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Abstract of DE 1 9642651 (A1 ) 
To store the presentation of \- 1 reference molecule 
in a memory of a computer system, \- 1 rigid 
substructure of the reference molecule is detected, 
where each substructure has \- 1 atom positions. 
Each atom position is linked with \- 1 atom position 
in the rigid substructure by a fixed link. Each rigid 
substructure has a global position and a global 
orientation in a global coordinate system. At least 2 
vectors are defined with a value and direction with a 
fixed position and orientation in relation to a selected 
rigid substructure from the rigid substructures. A set 
of \- 3 positions is selected in the selected rigid 
substructure to form positions of a multiple 
coordinate system where \- 1 of the positions is not 
co-linear with the remaining positions, and the 
positions are fixed in relation to the selected rigid 
substructure.; The multiple coordinate system 
defines a three-dimensional and angled local 
coordinate system. One or more of the multiple 
coordinate systems are selected to develop a 
multiple coordinate system field with data which can 
be coupled to each selected multiple coordinate 
system. A data set is stored in a data structure 
containing a number of data sets each containing a 
multiple coordinate system field and a vector field. 
The vector field has vector data which can be 
related to each of the vectors together with data on 
the molecule identities and the selected rigid 
substructure. Also claimed is a computer system to 
display \- 1 reference molecule with a memory and 
the facility to compare \- 1 reference molecule with a 
test molecule. A database is stored in memory with 
a display of \- 1 rigid substructures of each reference 
molecule. 
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PrQfungsantrag gem. S 44 PatG ist gestellt 

@ System und Verfahren zur Erkennung konformationsf lex&lar Moiekute 

(3) Ein Referenzspaicharprczea bevolkart etoe Datenstruktur. 
darart, daS die Datenstruktur alia moiekuiaren Strufcturen 
und/oder eta it en Substrukturen in der Detsnbank enthStt, 
die gemSR Elgenschaften von Tupeln kiassifiziert aind. Bei 
einer bevorzugten AusfQhrungsforrn werden dla Tupel von 
Platzen (z. B. Atomplatzen) der moiekuiaren Strukturan 
abgeleftat, und die Etganschaftan konnen von geometri* 
schen (und anderen) Informationen abgeteltet warden, die 
mit dan Tupeln in Bea'ehung station. Die Etganschaftan 
word on dazu verwendet, Indfees In der Datenstruktur xu 
definfaren, die mit tnvarlarrtor vaktorinforrnation (z. B. 
Information ubar drehbara Bindung(an) in schiafwinkligan 
lokalen Koordinatensvstemen, die von Tupeln arzeugt wer- 
den) verknOpft aind. Diase DarsteHungen sfnd invariant 
™ bezGgHoh der Rotation and Translation von moiekuiaren 
Stnikturen und/oder der Rotation von Substrukturen um 
angabundene drehbara Bindungen. Demgemafi wird die 
invariants Vektotinformation in dar Datenstruktur klasslfJ- 
zlert wobei steh die jaweiltgen Tupelaiganechaften an 
Stelten bsfinden, die durph den von dem jeweiGgan Tupel 
abgeJaiteten Index bastimmt werden. En VerglaichsprozeG 
erzsugt ein oder mehr Tupal, schiefwfnklige lokate Referenz- 
koordinatensvsteme und Indizas (TestkoortilnatensystBrntu* 
panndizes genannt) fur die Struktur (Substrukturen) einea 
Testmolakuls untar Verwendung der gleichen Technic die 
zum Bevoflcern dar Datenstruktur veiwandet wurde. Dar 
Testkoordinatensystemtupelindex grelft 




IA 
CD 

CD 



Ui 



Die folgondan An gab en slnd den vom AnmeMer elngerelclrtan Unterlagan errtnommen 

BUNDESDRUCKEREI 04.87 7020267551 49/Z4 



DE 196 42 651 Al 



Beschreibung 



10 



15 



20 



25 



30 



GEBIET DER ERFINDUNG 

Dlcse Erfindung bezieht sich auf das Gebiet der Rechnerbbbgie. Spezielier bezieht ssch die Erfindung auf ein 
Rechnersystem und ein Verfahren zur Erkcnnung jener MolekOle in einer Datenbank aus einera oder mehreren 
Molekuicn, die gemeinsam mit ernem oder mehreren Testmolekulen Substrulcturen enthaken, ancb wenn die 
MolekOle in der Datenbank Gruppen von Atomen enthalten, die ach frei um jegfiche kovalente Bindungen 
herum drehen konnen, die maglicherweise in derartigen Molekulen existieren fForsioiisflexibuitat). 

HINTERGRUND DER ERFINDUNG 

Da vorhandene Infonnationsdepots schneiier bearbeitet werden mussen und eine grdBere Vielzahl an Werk- 
zeugen verfflgbar wild, spidt der Rechner eine zonehmendwichtige Rolle bei der Funning und Rationaliaerung 
des Arzneimitteientdcckungs- und -entwurfsprozesses. 

Einer der grundfegenden Bestandteue jungerer Vorgehensweisen auf dieser Lime von Forschungsbemtthun- 
g en war der Wimsch, molekukre Kgenschaften, die auf den grundlegendsten Niveaus von Arzneimittelwechsel- 
wirkung involviert smd, zu berechnen, zu katalogisieren und nach ihnen zu suchen. % m 

Spezien konnen Rechner den Forschern helfen, rasch a priori anssichtslose Kandidaten zu etaimeren, um so 
langwierige und kostemntensive Aktivitats sichtungen zu vermeiden. Wichtiger, sie kdnnen es Forschern ermdg- 
lichen,neue vielversprechende Verbindungen zuidentffiziei^lcdglich basierend auf der verfugbaren Informa- 
tion auf der RezeptorsteUe oder auf anderen Fuhrungsverbindungen. , . 

Indem man in der Lage ist diese Aofgaben schnell durehzufuhren und Information zu gewmnen, die sofort m 
das Ausgangsgemisch des Arzneinrittels eingebracht werden kann, wird erwartct, daB die Suchstrategie dieses 
komplexe, multidlsziplinare BemOhen stark vereinfacht und die Geschwindigkeh, mit der neue und effektivere 
Arznebnmel idenufeiert, getestet und auf den Markt gebracbt werden, signifikant erhsht ^ 

Bis heute wnrden Hunderte von Proteinstrukturen mitteb Rdntgeiistrahlkristauographie- und magnetiscben 
Kernresonanz-(NMR>-Verfahren bestimmt Diese Daten sind ohne weiteres als eine offenniche Ressource von 
Mdekniarstrukturdaten verfugbar und erlanben es Pharmakobgen und Biobgen, verschiedene Aimekte von 
Proteinstrukturen und deren komplexe Verbaitcnsweisen zu untersucherL Zusatzlich zu cfiesen fiffentiicneu 
Datenbanken warde eine Anzahl von weheren (SfrentEchen und privaten) Datenbanken von klemen organi- 
schen MolekQlen durch die Anstrengungen von zahlrekhen pharmazeutischen und biotedmologischen Fumen 
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Es git verschiedene nnterscfaiedliche Szenarien, auf die man wahrscbeinlich im ProzeB des Eniwurfs von 
ArzneimittebstdBt: 

1 Es wird ein pharmakophores Modell von verschiedenen akthren Molekfilen vorgeschlagen; man wQnscht 
andere MolekOle zufindeawelche diepharmakophore Hypothese entweder untcrstutzen oder widertegen 
2. Eine Anzahl ungeprufter MolekOle kann bbbgische Aktrvrtat zeigen; man wunscht, vorhandene Beae- 
hungen zwischen dreidiniensbnaler Struktur und Aktivitat auszuwerten, um potentieU vorhandene biotogi- 
sche Eigenschaften abzuleiteiL 

X Es wurde vorgeschlagen, daB eine bestimxnte Konformauon eines gegebenen Uganden biologisch aktiv 
ist; es wird angenommen, daB eine dreidimensfonale Suche weitere Molekflle identiiiziert, die den Uganden 

nachahmen. . - 

4. Die dreicfimensionale Struktur einer Protein- oder DNA-Bindtingsstelle steht durch knstaUograpnische 
Untersuchungen zur VerfQgung. In diesem Fall werden Uganden gesucht, die zu der Bindungsstefle passen. 
Die Suche kann durch Verwenden von Information fiber das elektrostatfeche Verhalten fur eimge der 
Atomgruppen an der Stelb vergrSBert werden. Diese Technik ist von mehreren pharmazeutischen Firmen, 
wie Merck, American Cyanamki, Agouron eta erfolgreich angewendet worden, um Uganden zu entwerfen, 
die das reverse Transkriptase-Enzyra von HIV binden und blockieren. 

In jedem dieser Falle muB die entscheidende Information, welche Forscher in die Lage versetzt, HypoAesen 
zu entwickein, die potential neue Molekulkandidaten fur Synthese und Pruning bctrcffen, durch erne Suche m 
einer potendell sehr groBen Datenbank relevanter Information gewonnen werden, TatsSchlich ist dasmenreren 
Stufen medizinischer Chemieuntersuchungen gemeinsam zugrundeliegende Element die Notwendigkeit ones 
Suchens nach Datenbanken fur chemische Information. Das Foigende konzentriert sich auf den Fall m dem die 
znsuchenden Datenbanken struktureBe Information enthalten, die zu 3-dhnensionalen atomaren Verbindungen 

gC TWherwebe Uegt einem eine Verbindung/ein MolekCl C in Form eines Satzes von Kcwrumaten der 
AtoraplStze der Verbindung vor. AuBerdem ist eine Datenbank D> ± h. eine Sammlung von Satzen Dj - {. . 4 
gegebeiL Dj =1.4 ist eine sSnmkngvon Koordinatensatzen der Atomplatze fur jedes der beteuigtenMolekule. 
mnduneen, von denen einige drehbar sein konnen und somit fur eine Toraonsflenbihtat sorgen, verbmden die 
verschiedenen Atomplatze sowohl in C als auch den Datembaiikniitgliedern. Torsionsnexibflitat bedeutet. daB 
die Gruppen von Atomeii, die andenzwei Bndpunkten e^ 

zueittander rotieren konnen. Jede Verbindung/jedes Molekul kann mehr als erne drehbare Bmdung enthalten 
und somit kann die Verbindnng/das Molekfil eine beliebige emer unbegrenzten Anzahl v^iitat^ 
(dreidimensionalen Konfigurationen) Qber Drehungen nm diese Bindungen herum annehmeru Gelegentbch 
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konnen sterische Randbedingungen oder Energiebetrachtungen die Anzahl an WahlmdglicWceiten begrenzen, 
die Hauptnieitge des Satzes an mSglichen Konfigurationen bleibt jedoch mchtsdestowemgcr unbegrenzt Diesc 
Konformationsflexibmtat raolekularer Strukturca eroffnet eincn breiten Bereich von Moghchkehen bei der 
Suche nachpotentielfcn Liganden, wahrend sie gleichzeitig das Problem exponentieli srfiwiengermaditZusatz- 
ttch zn der (internen) Toretonsflexibilitat ist es den Mokkulen raogiich, starre Transfonnalionen im dretdimen- 
sionalen Raum zu erfahren, d h. das Molekffl ais ganzes kann rich drehen und verschieben. Im Folgenden wird die 
Verbindung/das MolekQl C austauschbar als Testvetbindung' oder Testmolekul' oder 'Abfrageverbmdong' 
oder'AWragemolekul'bezeichnet , _ . 

Bet efaier gegebenen Verbindung C und einer gegebenen Datenbank D, die Infonnaaonen fiber die 3-dimen- 
sionale Struktur dues moglicherweise groBeu Molekfilsatzes enthaJt, mussen die folgenden Operatfonen deft- 
niert und atisgefuhrt werden: 

L ^tnikturemnlgung*: die Fahigkeit, samtfichcs zur Verffigtmg atehendes stnikturelles Wissen fiber die 
Verbindung C in die Datenbank Deinzubauen; L ^ . 

2. ^trukturzugehdrigkdt*: Bestimmung, ob die Verbindung C bereits in der Datenbank D enthalten ist; 

3. ^ubstniktursuche": Idcntihzieren und Berichten aller MftgHedsverbbdungen von D, die eine bestimmte 
Substmktur der Verbindung C enthalten; ^ ^ 3 . 

4 w Ahnlichkeitssuche w ; Identifizieren und Berichten aller Mitgtiedsverbindungen von D, die der Verbmdung 
C 5hnlich sind Urn eine derartige Operation in der Datenbank D zu impiemcntieren, muB em Ahnbchkeits- 
maB d7. . .) definiert werden und zur Verfugung stehen, and 

5, ^ers^tursuche*: Identifizieren und Berichten aHer Witgiiedsverbindungen von D, die eine Sutstruk- 
tor der Verbmdung C darsteHen. 

Als erstes ist es leicht emzusefaen, daB das Pradikat der Strukturzugehorigkeit der Substniktursuxhoperadon 
untergeoTCinet ist Des weheren kfinnen aile Suchoperationen auf das reduziert werden, was w als "Substrnk- 
tuiihiulchkeit^bezeichnenwoUen. _ . 

Im folgenden wird der Ausdruck SubstnikturaJmlkhkeit dazu verwendet, eine emzeine Operation zu bezeicn- 
nea die* wenn eine Verbindung Q eine Datenbank D und ein AhnfichkeitsmaB d(. . .) gegeben sind, e Bestim- 
munff aller VerbindungsmitgHeder von D erlaubt, die eine Substmktur enthalten, die einer Substruktur von C 
IhnHeh ist Das AusmaB an Ahnlichkeit zwischen den fraglichen Molekuien kann durch die Funktion d(...) 
bestitnmt werden. Dies ist hier so zu verstehen, daB die impBzierte gemeinsame Substruktur nicht notwen&ger- 
weise ein eigentlichcr Subsatz von C sem muB. Die Ahnlfchketeninktion d(. . .) bleibt unspeztfiziert, wit nehmen 
jedoch an, daB sic von einer sehr allgememeri Natur ist 9 

Von dem Problem des Substrukturvergieichs kann gezeigt werden, daB es NP-voilstandnj ist, imtem bemerfct 
wird daB es das Problem des Subgraph-Isomorphismus als einen Spezialfall beinhaltet Die reale Folge dieser 
Aussage besteht darin, daB die Zeitkomplexitat zum Auffinden aller optimalen Losiingen eine exponenueUe 
Funktion der Eingabelange ist, und somit eoristiert kein effizienter Algorithmic (dknut polynomialer .Zeitkom- 
plexitat) zum Auffinden optimaler Losungea Zur Bcrcchnungskoraplexitat des Problems tragt des weiteren bei, 
daB eine Torsionsflesdbilitat um die kovalenten Bindungen des Molekflls herum ermSgUcht wird 

Vor der Beendigung dieses Abschnitts sollte eine letzte Unterscheidung erwahnt werden. Dies ist die Unter- 
scheidung zwischen 'Identffizieruiig' und 'Erkennung' jener Molekfile von der Datenbank D undMoIekfilen, die 
der gegebenen Testverbindung/dem gegebenen Testmolekul C ahnlich sind Die Identinzieruiig besenrankt sxh 
selbstdarauf, lediglich die Identkaten der Molekfile von der Datenbank D zu berichten, die mit der Testverbin- 
dung/dem Testmolekul C zusammenpassen. Andererseits erfordert eine Erkennung nicht nur das Berichten der 
Identitaten der zusammenpassenden Molekfile, sondern auch die Besthnmtmg und das Berichten der notwendi- 
gen Iransformatioaen, die jedes der identifizierten zusammenpassenden Molekfile in ''beste Ubereinstmimunr 
mit der Testverbindung/dem Testmolekul bringen. fBeste Obereinsummung^ poshkmiert die Atompiatze des 
Testmolekfils und der dazu passenden Datenbankmolekule in einer solchen Weise, daB die Anzahl von Pfctzen 
fan dreidhnensionalen Raum, die gltichzeitig von Atomen des Testmolekfils und Atomen jedes dazu passenden 
Datenbankmolekuls besetzt werden, die maximal mdgliche ist) Diese ^otwendTgen" Transformation^ umfas- 
sen Rotationen und Translationen der betrachteten Molekfile als ganzes, jedoch auch Rotationen von Struktu- 
ren innerhalb der Molekflle um die torsionsflcxiblen Bindungen der Molekfile herum 

Erkennung ist von der Sache her ein viel schwierigeres Problem als Identifiziening; dies ist im Fafl von sehr 
grofien Datenbanken D mit Molekfllen, die torsionsflexibel sind besonders offensichtlicL Dies ist so, wed die 
Anzahl von moglichen Transfonnatkmen rait der Anzahl von drehbaren Bindungen, die fur die gezeigte Tor- 
donsflejdbilitat sorgen, exponenticll zunimmt: die Berechnungsvorgange zum Fmden und Benchten der ncton- 
gen Transfarmatioft nehmen im aflgemeinen mit der Anzahl vonTransformationen zu. 



PROBLEME BEIM STAND DERTECHNDC 



Die inharente Beredinungskorapiexitat der Ftagesteflung bezflglich Sub^nikturalinKchkeh hat typisch alle 
zuvor vorgescMagenen Vorgehensweisen zur Bewaltigung dieses Problems bdastet Auch wenn man das 
Problem anf den Fall von starren Molekfllen ohne rotierbare Bindungen beschrinkt bleibt das Problem aur- 
grund seiner dreidimensionalen, Natur mit einer hohen Anforderung ffir die Beredmung. 

Um die Komplexitat der Fragestellung richtig einzuscMtzen, wird ein eindimensionaies Analogon aus oem 
tagCchenLeben prasenriert Ist ein Regal voU von Bfichem und einSatz wie 

"ffiklen von3I>An{ragen, die sich auf eine bestimmte FlexibiEtat in den Taigetstrukturen einsteflen tennen," 
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gegeben, so 1st einc Suchaufgabe als die Notwendigkeit defraicrt, jedes Auftreteu ahnlicher Redewendungen in 
dem Satz verfflgbarer BQcher zu findeu. Ahulich bedeutet, daB im allgemdnsten Fall eine Redewendung wie 

*wir bilden eme 3D-Suchanfrage derart; daB sie sich auf die ge wunschte Flexibilhat ems tellt* 

5 

al$ ein gultiges Zusammenpassen berichtet werden sollte. Mit anderen Worten sind Operationen wie Ersetzung, 
Einfugung und L&schung der grundlegendsten Informationselemente (in diesem Fall der Buchstaben) gerecht- 
fertigt and somit erlaubt (Im Fall von MolekQlen sind die grundlegendsten Infonnattonselemente die Atome 
eines Molekub.) 

io Eine direkte Vorgehensweise zur LSsung dieser Aufgabe erfordert die Erfassung der Inhalte ailer Bucher des 
Regals in etner erschopf enden, Cnearen Weise, d h. von links nach rechts, von oben nach unten, urn alle ahnlichen 
(in diesem Fall eindimeosionalen) Strukturen zu lokal&eren. Klarerweise erfordert ein derartiger Operations- 
modus mit zimehniender Anzahl von BQchern auf dem Regal (dL bu GrdBe der Datenbank) zunehmend mehr Zeit 
SelbstverstandOcfa kann es eine Anzahl heuristischer, Betrachiungen erleichtem, die Antwort zu findeiL Zum 

i$ Beisptel sind mogHcherwebc besttmmte Operationen nicht erlaubt, oder die Suchc kann auf eincn kleineren, gut 
spezifizierten Satz beschrankt werden; dies begrenzt unmittelbar die Anzahl moglicher Varianten fur eine 
gegebene Redewendung und macht eine Vorausberechnung und ein Speicbern altemativer Redewendungen 
plausibel Beim Suchen wird die Testredewendung mit dem Satz aller erlaubten, vorausberechneten Varianten 
verglichen. 

20 Alternadv kfmnen "SchlflsseF unter Verwendung eines Subsatzes von Worten mnerhalb eines Fensters von 
vorspezifcierter Breite vorausberechnet und gespeichert werden. Wenn es mit einer Anfrage konfrontiert ist, 
berecnnet das System den Satz von Schhlsseln fur die Anfrage und verwendet sie dazu, den Satz von Schlusseln 
zu suchen und zu fmden* der fur alle Redewendungen in alien BQchern berecnnet wurde. Mit anderen Worten 
werden, anstatt die Redewendungen direkt miteinander zu vergleichen, start dessen deren "Reprasentanten* 

25 verglichen, wiederum in einer linearen Welse. 

Eine Situation, die analog zu der obigea Suchaufgabe nach ahnltehen Redewendungen ist, existiert im Fall der 
Suche nach ahnlichen Strukturen in Datenbanken dreidimensionaler moleknlarer Information. Die folgende 
Darstelhmg reprasentativer Techniken ist dazu gedacht, bei der Identmzierung der Gemeinsamkeiten mid der 
Unterschiede von zuvor vorgeschlagenen Vorgehensweise n zu helfen. 

30 Die verschiedenen Techniken, die uber die J ahre hinweg vorgeschlagen wurden, urn dreidhneosionale moleku- 
lare Datenbanken zu durchsuchen, unterschetden sich im Grundsatz hinachtlich ihrer Definition und ihrer 
Verwendung des AhnlichkeitsmaBes das oben einfuhrt wurde. Sind eine Testverbindung C und eine 
Datenbank D gegeben, berecnnet das AhnlichkeitsmaB d(. . .) das AusmaB, in dem C und ein gegebenes MitgBed 
von D ahnlictt sind Die Werte. die dadurch erzeugt werden, daB C mit jedem der Mitgtiedsmolekule von D 

35 verglichen wird, erzeugen eine "Markienrng", die nachfolgend dazu verwendet werden kann, Antworten von 
Etandidaten in der Reihenfotge abnehmender QuaHtat zu ordnen. 

Zum Beispiel wird in dem Verfahren der 'Abbildung von Atomen* unter Verwendung des Ergebnisses von 
paarweisen Vergleichen der Zeilen von den Abstandsmatrizen zwcier Molekule der Tanimoto-Koeffizient 
berechnet Dieser Koeffizient wird als Eingabe in eine intermolekulare Ahnlichkehsmatrix verwendet Diese 

40 Matrix wird in Verbindung mit einem aufwendigen Algorithmic verwendet urn den Grad der Ahnfichkeit 
zwischen den zwei Molekfilen festzustellen. Die Berechnung wird fur alle Korabinationen zwischen einem 
Anfrageraolekul C und jedem der Molekule in der Datenbank D wiederhoit Wie es mit aufwendigen Algorith- 
men der Fall 1st, gibt es keine GarantJcn, dad der Algorithms alle richtigen Losungen findet Die Vorgehenswei- 
se stellt berechnungsmaBig hohe Anfordeningen und skaliert nicht gut mit der DatenbankgrSBe. 

4S Bei dem Verfahren der "Oiquen-Detektion" wird eine Anzahl verschiedener Orientiemngen fur jedes der 
Molekule in der Datenbank erzeugt, bevor es mit dem Anfragemolekfll C verglichen wird. Jede der Orientienn> 
gen wird dann uber C gelegt und markiert, basierend auf dem Vorhandensem oder Nichtvorhandensein von 
Datenbankatomen in der Nachbarschaft eines Atoms von C Alle Orientierungen, die dazu fuhren, daB weniger 
Treffer als maxima] mdglich stattfmden, werden ausgeschieden. Die Suche fahrt dann mh dem nachsten Molekul 

50 der Datenbank fort An jegiichem Punkt wihrend der Suche werden die letzten n besten Mariderungen behalten. 
Diese Technik steht im Kern des molekularen Mosaik-ModeDzersystems. 

Bei anderen bekannten Techniken werden die molekularen Strukturen als Verknupfungstaf ein dargestellt und 
somit als Graphen angesehea Die Vertices jedes derartigen Graphen entsprechen dm Atomplitzen des Mole- 
kuh. Wenn zwischen zwei gegebenen Atomplatzen eine Bindung existiert, dann weist der entsprechende Graph 

5$ eine Ecke auf, welche die relevanten Knoten vcrbindct Wenn jedes Molekul der Datenbank D durch einen 
Graph dargestellt wird; kann man eine Suche nach ahnficben Substrukturen durch Verwenden von Subgraphiso- 
morphismus-AIgorithmen ausfuhren. Wie bereits oben erwahnt wurde, ist das Problem des Subgraphisomorp- 
hismus NP- voflstandig, und so mit existiert kern effizienter Algorithmus. Eine neuere Arbeit verghch eine Anzahl 
verschiedener Subgraphisomorphismus- Algorithmen und legt Be weise fur die Nutzlichkeit ernes rOckverfolgen- 

go den Suchalgorithmus dar, der mit der ^erjferaertmg^TOzedui^-Heuristik verbessert ist Graphentheorensche 
Ergebnisse werden auBerdem dazu verwendet, Ahnlkhkehsfunktionen zum Vergleichen von molekularen Frag- 
menten (Substrukturen) zu entwickem. 

Eine Variation des obigen Schemas begmnt durch Blockbildung aQer Molekule in der Datenbank D in 
mehrere Blocks In diesem Fall wird das AhnlichkeitsmaB d(. . .) zuerst dazu verwendet, intermolekulare Ahnlich- 

65 keiten fur alle die Paare zu berechnea die durch Molekule in D gebOdet werden kannen. Nachfolgend wird ein 
Blockbildungsschritt dazu verwendet, die verschiedenen Molekffte in Blocke zu gruppiercn. basierend auf den 
Werten, die durch die paarweisen Vergleiche erzeugt wurden. Bei Vorlegen eines AnfragemolekQb C klassifi- 
ziert diese Vorgehensweise C durch Identinzieren des Blockes, zu dem C gettfrt Die Molekule der Datenbank 
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D, die am besten mit dem Anf ragemolekfil C ziisammenpassen, werden diesem Block ebenso wie dem Nachbar- 
block (oder den NachbarblQcken) enmommen. . 

Bisher war die Aimahrae, daB die betrachteten Molekule starre dreidimensionale Strukturen sind Dies ist 
iedoch meistens nicht der FalL Oblicherweise besitzen Molekfile mehrere interne drehbare Bindungen und sind 
somit in der Lage, eia Koatinuum von Konformationen. d h, <freidimensk>nale Koiifigurauonen, ^J^MoOm^ 5 
Hm und wieder konnen sterische Randbedmgungen oder Energiebetrachtungen die Anzahl von Wahlmdglicfa- 

^WCT^nd^Wfolekale einer Datenbank als starr behandelt, erleichtert dies die Suche in 3I>Datenbanken auf 
Kosten des Ausscheidens groBer Mengen wahrer Kandidaten: Wemigleich die gespeicherte Konfirmatkm ernes 
Molekuls moglicherweise nicht die (das) betrachiete pharmakophore Struktur/ModeU zeigt, kann eine andere 10 
Konfonnation des gieichen Molekuls biologisch aktiv sein, Somit offnet die KoiifoitnatbnsflmTrflit^ von 
molekularen Strukturen einen brehen Berrien von Moglichkeiten bei der Suche nach potentieilen Liganden. 
Gieicfazehig wird dadurch jedoch der Suchfcoraponente der herkdimnfichen Vorgehensweisen erne ernsmafte 

Burde auferlegt « . - - « 

1st eine Datenbank D von Molekfflen gegeben, erfordert eine direkte Vorgehensweise, die es jedem beBebigen is 
Suchalgorithmus erlaubt, konfbrmationsflexible Suchen in D durchzufuhren, das Speichem aller Konformatio- 
nen von jedem der Molekule in D, In der Praxis wird in Anbetracht eines Kontmuums mogiicher Konformatio- 
nen start dessen eine groBe Anzahl reprasentativer Konformationai gespeichert Die Auswkimgeo emer 
derartigen Vorgehensweise sind offenskMch: Die resultierenden Datenbanken haben ubemaltigeiiae GroBer 
und es sind sehr lange Suchzeiten notwendig. Eine alternative Vorgehensweise zum Speichem aller moghchen to 
Konformationen beinhaltet das Speichem jedes Molekuls in aur einer (oder einer Handvou von) Konforma- 
tionfen), Zum Beispiei verwendet das Ccmcord-3D-System einen Satz von Regem, am erne einzeme Konforma. 
tiorTzu erzeugcn, wobei die Verknupftmgstafem des Molekflls verwendet werden. Diese Vorgehensweisen 
gehoren mi wesentlichen zu einer Masse von Verfahren, welche die FlexibiBtat in die Datenbank legt 

In einer analogen Weise wendet eine Variante dieses Verfahrens einen Satz von Regem an (bestimmt mrttels 25 
Durchfuhren einer systematischen Konfonnationsanalyse von Ketten verschiedener Kombinatwrnen vonser^s 
HauptgerustatomenX um den Konformatxmsraum zu cntersuchen und ledigDch bestimmte Torsionswinkel fur 
jede drehbare Bindung zu behahen: Es wird em Satz von ^ederener^Komonnationen zusammen nut lhren 
entsprechenden "Masken" erzcugt Diese Masken werden nacbfolgend wahrend der aktaeilen Durchsuchung 
der Datenbank verwendet Bei einer verwandten Vorgehensweise wird eine groBe Anzahl von itonfonnationen 30 
des MoLekOls der Datenbank wahrend der Durchsuchung erzeugt und mit der pharmakophoren ^Strufetur 
vergiicben. Dies ist eine berechnungsmaBig aufwentfge Vorgehensweise, iind jegbcAe Versiwte (durch die 
Verwendnng von HeunstikenX diese Belastung zu reduzieren, haben erne direkte Einwirknng auf fle Quanta! 
der erzeugteti Ergebnisse: sonst zutreffende Gegenstucke werden nun fibersehen. Bade dieser Verfahren sind 
fur eine Klasse von Techniken reprasentativ, welche die K^nf ormationsflexibilitat in the Suche verlegea as 

Es gibt auflerdem eine dritte Vorgehensweise, bei der die FlexibiBtat in die Anfrage sdbst verlegtwd. Die 
Anfrage kombiniert in diesem Fall sowohl starre als audi flexible Komponentea und wird nntteb Durchsuctum 
einer Datenbank von Verbindungen mit "bekannter* Aktivitat iterativ verfeinert, bis me gewuiischte Setectrvrtat 
erzieit wird. Stent einmal die endgultige Anfrage zur Verfugung, wirdsiedazu verwendet, eine Datenbank von 
Vettmdungen mit ^mbekannten* Aktrvitaten zu durchsuchen, um poterraelle Verbmdungen zu identifizieren. 40 

Die erfolgreicheren Suchtechmken greifen das Problem der Konformationsflexftlitft m emer beredinungs- 
maBfe heraus fordemden Weise an) die SchhiBfolgerung frfiherer, Arbeiten war, daB em fteaWes dreicfimensio- 
nakTsuchen unter Verwendnng der von Clark et al entwickelten Vorgehensweise als em Minimum erne 
lOOfache Verlangsamimg gegenuber dem starrea Ver^eichsfafl zur Folge hat Diese Verlangsamimg schemt 
tvnisch fur und unabhangig von der aktuellen Technik zu sem, die verwendet wird 4S 

In einer Vergleichsstudie von Haraki et aL wurde gezcigt, daB ein Ver^ern emer Datenbank mit Mehrfach- 
tonformationen eines gegebenen MolekOls ira aUgemeinen die Leistungsfahigkeit ones Suchalgontbrnus sta- 
gert. Die gleiche Studie steUte jedoch auch test, daB die resultierende Effektmtat stark von dem Verfahren 
abhangig h% das zur Erzeugung der verschiedenen Konformationen, die zu der Datenbank hinzuzufugen smd, 

verwendet wird. . ... , „ ^ 

Ab eine Alternative zur mehrfachen Aufaahme eines MolekOls in der Datenbank wird tm/T>i^pamrauin 
ein bestimmter Typ von Mmimienmg ausgefflhrt Diese Vorgehensweise ist viel schneJler, sie erfordert jedoch 
bestimmte Beziehungen zwischen der Anzahl von strukturellen Randbedingungen und der Anzahl von exutte- 
renden drehbaren Bindungen; des weiteren Obernimmt sie alle Probleme von nicht hnearen Optmnerungs-Vor- 
irehensweisen. 55 

Nodi ein weiterer Typ von Technik versucht im wesentlichen, ein starres Andocken kdiglich anf denstarren 
Subteflen des MolekOls diirchzufuhren and dann cfie Kompatibuitat der verschiedenen angedockten Teie m 
einer Nachbearbettungsphase zu uberprufea Diese Technik stelh im aUgemeinen berechnungsmiBig hohe 
Anfordernngen. . . T , 

Eine Anzahl von Abkurzungen in Form von Such-Heuristiken wurde emgefumx um emiges an berechnungs- 60 
maBiser Belastung zu vernnndern, jedoch nicht ohne nachteflige Auswirkung auf die QuaMt der erzeugten 
Ergebnisse, Um ein Gegengewicht zu dieser Aussage zu bikten, sind diese Heurisnken voaemer allgemeineren 
Anwendbarkeh und k6nnen auch m dem FaD verwendet werden, in dem Konformationsflexibditat keiner der 

Parameter des Problems ist w m _ „ , . 

Insbesondere gibt ein gewisser Stand der TechmTc eine sehr grundhche Darstellung an und ftlhrt erne Ver- 65 
rieicfasstudie einer Anzahl von Deskriptoren zum Zwecke einer DatenbankskAtimg aus. Die Desknptoren 
decken einen groBen Bereich an Eigensdwften der Molekule in der Datenbank ab: physAalische, chemische, 
geometrische ebenso wie verschiedene Kombinationen derselben. Dies UirterscheicUingsfamgkeit emiger der 
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vorgeschlagenen Deskriptoren ist ermutigend, die Ergebnisse wurden jcdoch unter Verwendung einer kJeinen 
Datenbank mit nur einigen wenigen tausend Verbmdongen erzielt 

Dazu in Beziehung stehende Arbeiten ftihrten eia zweistufiges Verfahren ein,dasun wesenttfchen cfie Gestak 
charakterisiert, ohne die Notwendigkeit zur Frfifung einer Vielzahl von Andockorientierungen. In der ersten 
5 Stufe wird fur jedes der Molekule in der Datenbank durch Set2en geeigneter Bits in emem Bit-Vektor eine Zahl 
mit 2048 Bit erzeugt Die zu setzendeu Bits werden basierend auf einer 32-Bit-Codierung jedes Dreiecks 
ausgewahlt, das durch drei Atomplatze in dem Molekul gebildet wird Harerweise enthalt die Zahl geometrische 
Charakteristika, die fur jedes Molekul spezifisch sind; aufgrund der Art imd Weise, in der sie erzeugt wird, ist die 
Darstellung jedoch nicht eindeutig. WShreod der zweiten Stufe wird eine aJmBche 2048-Bit-Zahl fflr das Testrao- 
i0 lekfil erzeugt und mit jcdem der gespeicherten Signaturen verglichen, Fur jene Molekule, deren Signaturen 
einen Schweuwert uberschrehen, werden wiederum Tripletts von Atoiuplatzen gebildet und mit den Tripletts in 
dem Testmolekul zwecks Oberschneidung verglichen. Wenngtefcb das Verfahren die relative Orientierung 
zwischen einem KandMaten und dem Testmolekul nicht gewinnt, erweist es sich als Sichtnngsschritt adlquat 

Im gesamten beschriebenen Stand der Technik skalieren die Techniken entweder nicht gut mit der Grofie der 
j5 Datenbank (aufgrund der Notwendigkeit fur eine serielle Abtastung und Bearbeitung aller Eintrage) oder 
verwerten die durch die drehbaren Bindungen auferlegten Randbedingungen, urn das AusmaB der Suche zu 
begrenzen, nicht volistandig. 

Anders als bei den Techniken, die eine lineare Abtastung der Datenbank D erfordern, basteren Hash-Techni- 
ken aul der Identification besdmmter invarianter Deskriptoren (Indizes), die dazu verwendet werden kSnnen, 
ao eine partieile Darstellung, sagen wir eines MolekOls, in einer Suchtabelle zu speichern. Korapatible Molekule 
kdnnen durch Berechnen der Indizes von einer Testemgabe wiedcrgewonnen werden, indem die partidle 
Darstellung aus der Suchtabelle zuruckgehoJt und das Ergebnis direkt integriert wird, wodurch die Notwendig- 
keit elhniniert wird, die gesamte Datenbank fur einen oder mehrere Vergleiche abzutasten* Fur Molekule 
kdnnen Indizes durch Verwenden von Atomtupem (z. B. Tripletts) mit Atomeigenschaftm oder lupehx mit 
25 kleinen Obcrflachens t&cken gebildet werden, die mit ihrcn Normalen und den chemischen ESgenschaften an der 
Oberflache verknupft sind (zwei unabhangige StQcke sind in diesem Fall ausreichend). 

In fruheren Arbeiten wurde argumentiert, daB die Verwendung von Indizes hochdimensionaler Natur (mit 
einer groBen Anzahl von einzeinen Werten) entscheidend fur das richtige Verhalten cfieser Techniken 1st wenn 
die Ausdehnung der Datenbank groS wird Zwei Hauptpunkte tragen zu diesem sehr allgeraeinen Ergebnis beL 
30 Erstens sind FScher m einer Suchtabelle mit einem grdEeren Satz von Fachero im Durchschnitt wenfger besetzt 
Und zweitens kann eine grSbere Quantisierung entlang jeder der wdexdhnensionen verwendet werden, womh 
die Wahrscheinlichkeit der Oewiimung des giekhen Index wahrend des Wiedcrauffmdens ShnHcher Entitaten 
erhdhtwird 

Anders als bei auf Abtastung basierenden Techniken hat jedoch die Klasse von Hash-Teclinik-Algorrtbmen 
35 die Spekheranforderungen erhdht Insbesondere die verschiedenen Stufen des Algorithms leiten ihrc Gc- 
scbwindigkeit aus dem Voraus berechnen von Ergebnissen und dem Speichern derselben in geeignet aufgebau- 
ten Suchtabeflen ab. Diese Vorausberechnung kann off-line durchgefOhrt werden, erfolgt lediglich emmal, und 
die Ergebnisse werden auf Platte gespeichert und verwendet, wenn notwendig. Die Hash-Technik-Vorgehens- 
weise schafft im wcsentlichen Raum fur die Berechnnng; angesichts einer Verminderung der Kosten iangsamer 
^0 Speicher wird der KompromiB zunehmend vertretbar und vernGnfdg. 

AUFGABEN DER ERFINDUNG 



Eine Aufgabe dieser Erfindnng 1st ein verbessertes Rechnersystem und Verfahren zur Bestunmung jener 
45 Molekule aus einer Datenbank D, die ein oder mehrere Molekule, die Substrukturen beinhalten, die Substruktti- 
ren von einem oder mehreren Testmolekulen C entsprechen, zusammen mit dem Satz von starren Transforraa- 
tionen (d h. starre Rotationen und Translationen) enthalt, der bewirkt, daB j edes dieser Molekflle am besten mit 
dem (den) Tcstmo!ekQl(en) C uberlappt ("beste Obereinstininiung^ das beschriebene System und Verfahren 
kdnnen dies erreichen, auch wenn die Molekule in der Datenbank Gruppen von Atomen enthalten, die frei urn 
so jegUche kovalente Bindungen herum rotieren kdnnen, die mdgWcherweise in dem Molekul vorhanden sind 
(Torskmsflexibflhat). 

ZUSAMMENFASSUNG DER ERFINDUNG 



55 Dieses System und dieses Verfahren identifizieren Molekflle und/oder molekulare Substrukturen in einer 
Datenbank D. die ahnlich oder identisch mit einem oder mehreren Testmolekulen und/oder Substrukturen 
und/oder Teif en von Substrukturen dieser Testmolekule sind. Das System und das Verfahren legen aufierdem 
den Satz starrer Transformationen (d h. starrer Rotationen und Translationen) fest, der bewirkt, daB jedes der 
Molekule, die in D identifbdert sind, am besten mit dem (den) Testmolekul(en) uberlappt Dies word© oben als 

so "beste Oberemstinunung ,r bezeichnet Anders als bei Techniken, die im Stand der Technik enthalten sind, ist die 
Festlegung der geeignet en starren Transformationen weder das Ergebnis trgendemer erschopfenden Suche im 
Raum mdgHcher Konformationen, noch irgendeiner anderen aqurvalenten Suchprozedur. Statt dessen tritt sie 
gletchzehig mit der Festlegung der Identit&ten jener Molekule in D auf, die Substrukturen enthalten, die ahnlich 
oder identisch mit Substrukturen sind, die in dem (den) Testmolekulen) enthalten smd Wiederum ist aufgrund 

65 der auf Hash-Techniken basierenden Natur der Erfindimg keine fineare Abtastung der Molekule in D notwen- 
dig 

Die Erfindung verwendet einen ReferenzspeicherprozeB, ura eine Datenstruktur zu bevdlkern, so dafi die 
Datenstruktur alle molekularen Strukturen und/oder Substrukturen in der Datenbank enthalt, die gemtB 
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EiEenschaften von Tupelo klassifizicrt sind In einer bevorzugten Ausfflhningsform werden die Tupel von 
Plltzen (z, B. AtomplStzen) der molekularen Strukturen (Substrukturenji abgelettet, die gewahlt sind, urn die 
Tupel zu erzeugen, und die Eigenschaften sind geometrische (and andere) foformationen, cfie sich auf die 
gewShlteo Tupel beziehen. Die Eigenschaften werden dazu verwendet, Indizes in einer Datenstruktur zu 
definieren, die mit invariamen Vektonnfonnationen (Vektorinfonnation genannt) verknupft sind, die zu den 
Molekulen der Datenbank D gehdren. Zum Beispiel kdnnen die invarianten Vektoren drehbare, Bindungen in 
ReferenzmoiekOlen m der Datenbank D repraseetiereiL Diese invarianten Vektoren (z, B. drehbare Bindungen) 
werden in schiefwinkiigen iokaien Koordmatensystemen dargestellt, die von Tupeln erzeugt werden, die von 
starren molekularen Substrukturen abgeleitet sind, an welche der (die) Vektor(en) angebunden ist (sind). Diese 
Darstellungen sind invariant bezuglich der Rotation und Translation voa molekularen Strukturen und/oder der 
Rotation von Substrukturen urn die angebundene(n) drehbare(n) Bindung(en). DemgemaB kdnnen invanante 
Vektorinformationen, die zu Molelallett in der Datenbank gehdren, bezuglich der Tupeleigenschaften dadurch 
Idassifiziert werden, dafl die invarianten Vektorinformationen an Stellen {Vektorfeldern) der Datenstniktur 
gespeichert werden, die mit dem von dem jewefligen Tupel abgeieketen Index verknupft sind Sobald die 
Datenstruktur bevolkert ist, erzeugt ein VergleichsprozeB einen oder mehrere Tupel schiefwinklige lokale 
Referenzkoordinatensysteme und Indizes (Testkoordinatensysteratupelindizes genannt) fur die Struktur (Sub- 
strukturen) ernes TestmotekQls unter Verwendung der gleichen Technik, die zur Bevdlkerung der Datenstruktur 
verwendet wurde- 

Der Testkoofdinaiensystemtupelindex wird dazu verwendet auf die invariante Vektorinformation znzugret- 
fen, die sich ia dem Vektorfeid des Datenstrukturindex beffrdet, der rait dem Testkooidinatensystemindex 
zusammenpa&t Es wird ein ZShlwert der Haufigkeit des Zusammenpassens der Vektorinformationen (Indizes) 
von molekularen Strukturen (Substrukturen und/oder Teilen) in der Datenbank mit den Testkoordinatensystem- 
tupelindizes, die fur das Testmolekul erzeugt wurden, um zu bestimmen, welche molekularen Strukturen (Sub- 
strukturen und/oder Teile) kientisch oder ahnHch zu jenen in der Datenbank passen, und der notwendigen 
starren Transformationen behalten, die zugehSrige Substrukturen in Obereinstimmong miteinander brmgen. In 
einer bevorzugten Ansfuhrungsform wird die Kombination von gezahlten Vektorinformationen und den not- 
wendigen starren Transformationen von Kandidaten ausgeschieden, wenn sie nicht durch eine oder mehrere 
andere Substrukturen bestatigt ist 

KURZBESCHREIBUNG DER ZHCHNUNGEN 

Die vorstehenden und weitere Aufgaben, Aspekte und Vortefle der Erfindung werden aus der foJgenden 
detaiDierten Beschreibung von bevorzugten Ausfuhrungsfonnen der Erfindung unter Bezugnahme auf die 
Zeichnungen besser verstandlich werden, die wk folgt beschrieben sind: 

Fig. 1 ist ein Blockcfiagr amm eines Rechnersystems, das die vorliegende Erfindung verkarpert 

Fig, 2A ist eine Darstellung einer molekularen Struktur, die starre Substrukturen von Atomgruppen in dem 
Moieku% die Rotationsnatur von zwei typiscben Diehbmdungen zwischen starren Substrukturen, ein globales 
Koordinatensystem, ein scbicfwinkliges lokales Koordmatensystem, ein 'TCoonimatensystem^Tuper, welches 
das schiefwinklige lokale Koordinatensystem definiert, und erne Daisteflung von zwei invarianten Vektoren, me 
zwei Punktpaare auf zwei oder mefar starren Substrukturen verbinden, sowte eine erste Konfonnauon der 
molekularen Struktur zeigt ^ # 

F^, 2B ist eine Darstellung der molekularen Struktur von Fig. 2A, die em "magisches Koordinatensystem 
zeigt, das mit einer der starren Substrukturen verknupft ist 

Rg. 2C ist eine Darstellung, die eine zweite molekulare EConfonnation der molekularen Struktur, das globale 
Kbordmatensystenv das schiefwinklige lokale Koordinatensystem und die invarianten Vektoren von Fig. 2A 
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Fig. 3 ist eine Sequenz von Zeichnungen, die zeigen, wie Platzsatze K-0 definiert sind (Fig. 3A), wietemy- 
Stellen Du definiert sind und dann verwendet werden (Fig. 3B) und wie Tupel (Fig. 3B bis 3E) durch Wahlen 
eines Satzes von einem oder mehreren Atomplatzen und/oder Dumray-FIatzen Du von der molekularen Struk- 
tur definiert sind. . „ w 

fig, 4 ist ein Blockdiagramm einer Datenstruktur, die einen Index, der zu einem Tupel gehfirt nut einer 
Vektorinfonnation verknupft, die der Darstelhmg von zwei oder mehr invarianten Vektoren entspricht, die an 
jedes dersdiiefwinkfigen tokalenKoordinatensysteme des Tupels. das den Index erzeugt angebunden sind 

Fig.5, welche die Flg.5A und 5B umfaBi, ist ein HuBdiagramm, das die Schritte der Bevfflkenmg der 
Datenstruktur von Fig. 4 zeigt, damit sie strukturelle Wormationen und andere Informationen Qber em oder 55 
mehrere Referenzmolekule enthalt 

welche die Fig-fiA, 6B und6C umfafit, ist ein FtuMagramm eines bevorzugten Verfafarens, das die 
Schritte der Bestimmung, (a) welche Referenzmolekule in der Bibiiothek (Datenbank D% die dn oder mehrere 
Molekttle enthalt, einem Testmolekul fur einen ausgewahlten Satz einer oder mehrerer molekularer Eigenschaf- 
ten ahniich sind (« mit diesem zusammenpaBt) und (b) des Satzes von starren Transformationen zeigt die das so 
Testmolekfil mit den in (a) identifizierten Referenzmolekttlen in Obereinstimmung bringt 

Fig. 7 ist ein Blockdiagramm einer Abstimmtabelle, die dazu verwendet wird, die relative Frequenz (Haung- 
keits werte) von: 

(a) den Identhaten jener Molekfile und/oder molekularen Substrukturen in der Datenbank D, die nut dem 
Testmolekul fur einen gegebenen Satz von molekularen Eigenschaften zusammenpassen, und 65 

(b) den starren Transformationen zu bestimmen, die das Testmolekul roh den in (a) identifizierten Ref erenzmole- 
kftlen in Obereinstimmung brmgen* 
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DETAILLIERTE BESCHREIBUNG DER ERFINDUNG 

Nunmehr bezugrtehmend auf die Zeichnungen und spezieller auf Fig. 1, ist dort die Blockdiagrammdarstellung 
einer allgemeinen Rechner-Harxrwareumgebung 100 gezeigt Dieser Rechner 100 kann einer aus der Internatio- 

5 nal Business Machines Corporation (IBM) Personal System/2 (PS/2) Familie von Personalcomputern, ein RISC 
System/6000 oder ein Power Parallel System (SP/x) sein. Das System 100 beinhahet eine Oder mehrere Zentral- 
prozessoreinheiten (CPU) 10, die der x86-Architektur yon Intel entsprecben oder aus einem Mikroprozessor mit 
reduziertem Befehlssatz bestehen konnen. Die CPU 10 ist an einen Systembus 12 angebunden, rait dem ein 
SchreuV/Lese-SpeLcher und/oder ein Speicher mit wahlfretem Zugriff (RAM) 14 verbundcn ist, die einen oder 

10 mehrere Cache-Speicher, einen Festspeicher (ROM) 16> einen Emgabe^/Aiisgabe- Adapter 18 und einen Benut- 
zerschnittstellen-Adapter 22 umfassen konnen. Das RAM 14 sorgt fur eine temporary Speicfaerung eines oder 
mehrerer Anwenderprogramme 40, die einen Code und/oder Daten enthalten, wahrend das ROM 16 typischer- 
weise den grusdlegenden Eingabe VAusgabe$ystein(BIOS}-Code beinhahet Der E/A-Adapter 18 1st mit einem 
oder mehreren Speicher einheiten mit direktem Zugriff (D ASDs) verbunden, die hier als ein Floppy-Laufwerk 19, 

1$ ein Festplatten-Laufwerk 20 und ein CD-ROM 21 dargestellt sind. 

Das Festplatten-Laufwerk 20 speichert typischerweise das Rechnerbetriebssystem (OS), wie das OS/2-Be- 
triebssystera von IBM, und verschiedene Anwenderprogramme, Daten und/oder Datenbanken 50, von denen 
jede uber den Systembus 12 selektiv in das RAM 14 gekden werden kann, Mit dem Benutzersdmittstefien- 
Adapter 22 sind eine Tastatttr 24, eine Maus 26 und/oder andere BenuizenchirimteUenemheiten (nicht gezeigt) 

30 verb widen. 

Das System 100 kann auBerdem eine Anzeige 38 umfassen, die hier als KathodenstrahIr6hren(CRT)-Anzeige 
dargestellt ist, die jedoch auch eine Flussigkristallanzeige (LCD) oder eine andere geeignete Anzeige und/oder 
eine graphische Benutzerschnittstelle (GUI) sein kann. Die Anzeige 38 ist liber einen Anzeigeadapter 36 mh dem 
Systembus 12 verbundea Ein Multimedia-Adapter 34> wie ein ActionMedia 11 Display Adapter von Intel 
25 Corporation, kann ebenfaUs nut dem Bus 12 sowie mit einem MDcrophon 32 und einem Lautsprecher 28 
verbunden sein, Der Multimedia-Adapter 34 wird von einer geeigneten Software, wie Multimedia Presentation 
Manager/2, unterstfitzt Diese Systeme 100 und Aqurvalente dieser Systeme sind dem Fachmann aBgemein 
bekannt 

Personal System/2, PS/2, OS/Z RISC System/6000; Power Parallel System, SP/x und IBM sind Handelsmarken 
30 der International Business Machines Corporation. 

Emige der Anwenderprogramme 40 werden unten als ProzeBverfahren beschrieben. Molekulare Datenban- 
ken 50, die ebenfaUs unten beschrieben sind, werden typischerweise in den Speichereinhehen gespeichert, z. B» 
dem Festplatten-LamVerk 20. 
Fig. 2A ist eine DarsteUung enter molekularen Struktur 200, die starre Substrukturen (210, 220, 230) von 
35 Atomgruppen in dem Molekfll 200, die Drehnatur 215 von zwei typtschen drehbaren Bmdimgen (218a, 218b) 
zwischen starred Substrukturen (210, 220) beziehungsweise (220, 230), ein globalcs Koordinatensystem 235, ein 
scMefwinkliges lokales Koordinatensystem 245 und ein 'TCooidinataasystem-TupeT zeigt, welches das schief- 
winkEge lokaie Koordinatensystem 245 definiert AuBerdem ist in Fig. 2A die DarsteUung von zwei invarianten 
Vektoren gezeigt: (a) dem Vektor 238, der zwei Punkte (D, G) anf einer oder mehreren starren Substrukturen 
40 (210, 220) verbindet, und (b) dem Vektor 248, der zwei Punkte (O, Q) auf einer oder mehreren starren Substruktu- 
ren (220, 230) verbindet Schliefilich zeigt Fig. 2A eine erste Konf ormation 200 der betrachteten molekularen 
Struktur. 

Unten sind einige, der Ausdrflcke, die imText eingehend verwendet werden, definiert und klargesteUt 
Eine molekulare Struktur £200, 250) ist ein Satz von Atomen (z B. AS), die uber chenrische Bindungen, 
4$ typischerweise MO, miteinander verbunden sind. (Bindungen sind duxch Buchstabenpaare bezeichnet, die den 
zwei durch die Bindung verbunden en Atomen entsprechen.) Im allgemeinen ist die molekulare Struktur 200 
typischerweise durch einen Satz von Koordmaten fur die von den verschiedenen Atomen besetzten Platze 
definiert Zum Beispiei definieren die Koordinaten (x, y, z) die Position von Atom O in dem giobalen (Labor-) 
Koordinatensystem 235. Das globale Koordinatensystem 235 wird for die Zwecke der folgenden Analyse als f es t 
50 und Jconstant angenommen. 

Des weiteren definiert eine Liste der chemischen Bindungen, welche die Platze miteinander verbmden, z. B. 
MO, ebenfaUs die molekulare Struktur 200. Den verschiedenen Piatzen (A-S) der molekularen Struktur 200 
und/oder den jeweiligeu Atomen, die diese Platze in dem giobalen Koordmatensystem 235 besetzen, werden 

typischerweise Bezeichnungen (zum Beispiei: eine Zahl), zugeordnet, die sie voneinander unterscheiden. Fur 
55 unsere Zwecke werden wir austauschbar einen Buchstaben (z. E A-S) und/oder eine Zahl verwenden, urn das 
Atom und/oder den Platz, an dem stch das Atom in dem giobalen Koordinatensystem 235 befmdet, zu bezeich- 
nen. 

SchlieBKch wird zusatzlich zu der Liste der Koordinaten der Platze und der Liste von chemischen Bindungen 
eine liste der Atomtypen (z. & N, C O, H etc.) fur jedes der Atome berehgestellt, welche die verschiedenen 
60 Platze der molekularen Struktur besetzen. 

Es ist zu erw&hnen, dafi gelegenthch eine molekulare Struktur unter Verwendung der liste von chemischen 
Bindungen und der liste von Atomtypen fur jedes der Atome, die an der Struktur betefligt sind, spezmziert wird 
Eine molekulare Struktur, die in einer derartigen Weise defmiert wurde, ist auf keinen Fall unbestimmt: 
tatsachlich konnen die Koordinaten der AtomplStze aus der gegebenen Information nnter Verwendung einer 
65 Vielzahl Qblicher Verfahren gewonnen werden. 

Eine Bindung, MO, reprasentiert eine chemische Verbindung zwischen zwei Atomen (M, O) in der molekula- 
ren Struktur 200. Bindungen sind typischerweise in Form der Bezeichnungen definiert, die mit den zwei Atom- 
platzen verknflpft sind, welche die Bindung verbindet 
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Einige der Bindungen in einem gegebenen Molekfil kdnnen drehbar sein und somh fur eine Toraonsflexibilitat 
215 sorgen: die starren Substrukturen (21ft 220] sind an den zwei Endpunkten einer drehbaren Bindung 218a 
angebunden und kfinnen daher relativ zueinander rotieren 215. In einer aJhniichen Weise sind die starren 
Substrukturen (220, 230) an den zwei Endpunkten einer drehbaren Bindong 218b angebunden und kdnnen daher 
relativ zueinander rotieren 215. 5 

Innerhalb jeder der drei starren Substrukturen (210, 220, 230) auf jeder Seite von drehbaren Bindungen (218a, 
218b) sind Atome miteinander durch Bindungen verbunden, die eine derartige Torsknsflexibilitat nicht eriauben 
(nicht drehbare Bindungen - AC, MO). Dies trifft im allgemeinen Fall nicht zu: es existieren molekulare 
Substrukturen, die eine schamierartige HexMifclt zeigen, eine Behandlung dieser Substrukturen ubersteigt 
jedoch den Umfangdieser Analyse. ™ 

Daher sind die starren Substrukturen (210, 220, 230) Strukturen aus einem oder mehreren Atomen, cue Qber 
nicht drehbare Bindungen miteinander verbunden sind. Gruppen, die aus einera Atom, P, bestehen, das Ober 
Bindungen wie NP mit einem Satz von Atomen wie G, H, IJ> K, I* M, N und O verbunden sind, werden nicht als 
separate starre Substrukturen betrachtet, ungeacfatet der Tatsache, daB die Bindung NP m5g[icherweise drehbar 
ist Dies iiegt daran, daB jegiiche Rotation des Atoms P um die Bindung NP herura den Ort voa P in dem globalen t5 
Koordmatensystem 235 nicht andert Des weiteren andert jegiiche Rotation des Atoms P um die Bindung NP 
henim den Ort von P bezuglich des Sates von Atomen G, H, I, J, K, L, M, N und O nicht Es ist auBerdem zu 
erwahnen, daB starre Molekule, d h. jene Molekfile, die keine drehbaren Bindungen enthalten, als Molekuie mit 
einer starren Substruktur definiert werden kdnnen; in einem derartigen Fail ist das gesamte Molekul die 
Snbstruktur(210,220,230). » 

Es ist auBerdem zu erwahnen, daB die Definition der Koordinaten (x y. z) von drei oder mehr Atomen 
(Hatzen) (z. B. G-P einer gegebenen starren Substruktur 220) in dem globalen Koordinatensystem 235 gemlgt, 
urn eine globaie Position 0"0' und eine globaie Orientierung (O V, Oy, OV) fur die starre Substruktur, r B» 
220, in dem globalen Koordinatensystem 235 zu definieren. Man beachte auBerdem, daB der Satz von drei oder 
mehr Atomen (Platzen), der die globaie Position und Orientierung fur die starre Substruktur, z. B. 220, definiert, 25 
das Atom (den Platz) D beinhalten kann, da die Rotation 215a um die drehbare Bindung 218a der starren 
Substruktur 210 herum in bezug auf die starre Substruktur 220 die Position des Atomes (dem Platz) D bezflglicn 
der starren Substruktur 220 nicht andert Bei Verwenden ernes fthnlkhen Arguments kann der Satz von drei oder 
mehr Atomen (Pfctzen), wdche die globaie Position und Orientierung far die starre Substruktur 220 definieren, 
das Atom (den Plat2) Q beinhalten, da die Rotation 215b um die drehbare Bindung 218b der starren Substruktur 30 
230 herum in bezug auf die starre Substruktur 220 die Position des Atoms (den Platz) Q bezfigJtch der starren 
Substruktur 220 nicht andert Es ist auBerdem zu erwahnen, daB bei der Definition einer globalen Position und 
Orientierung fur die starre Substruktur 210 der Satz von drei oder mehr Atomen (Piatzen) das Atom (den Platz) 
G zusatzKch zu den Atomen (Piatzen) A-F beinhalten kann. In einer analogen Weise kann bei der Definition 
einer globalen Position und Orientierung fur die starre Substruktur 230 der Satz von drei oder mehr Atomen 33 
(Piatzen) das Atom (den Platz) O zus§tzlich zu den Atomen (Piatzen) Q-S beinhalten. 

Derazufolge besitzt der Vektor 238 (bzw. 248), der unten definiert ist, eine feste Position und Oneanerung 
bezuglich entweder der Substruktur 210 odor 220 (bzw. 220 oder 230), weiche die drehbare Bindung 218a (bzw. 
218b) verbindet Dies geschieht, weO sich die Position und Orientierung der drehbaren Bindung 218a (hzw. 218b) 
bezughch jeder starren Substruktur ungeachtet der Rotation in dem globalen Koordinatensystem 23S jeder der 40 
Substrukturen um die drehbare Bindung 218a (bzw. 218b) herum nicht Sndern. 

Im folgenden kann der Ausdruck starre Substruktur (210, 220, 230) austauschbar mit dem Ausdruck starre 
Gruppe (210, 220, 230) verwendet werden. . 

Wie unten erdrtert wird, brauchen die Vefctoren 238 (bzw. 74S\ die, wie bereits erwahnt, erne feste Position 
und Orientierung bezuglich entweder der starren Substruktur 210 oder 220 (bzw. 220 oder 230) besitzeu, nicht m 45 
Form der drehbaren Bmdung(ed) 218a (bzw. 218ty die von der starren Substruktur ausgehen, definiert zu 
werden. Tatsachhch kann der Vektor 238 (bzw. 248) fur eine gegebene starre Substruktur jeder Vektor sein, der 
so definiert werden kann, daB er bezuglich der starren Substruktur Starr angeordnet ist 

Fur den Augenblick wird der Vektor 238 (bzw. 248) mit Hflfe der drehbaren Bindung 218a (bzw. 218b) 
defimert:ziimBeispidraUendieGr5Beunddie Richtung oes Vektors 238 (bzw^ so 
(bzw. 218b) zusammea Es wird angenoraroen, daB die Konvention fBr <fie Richtung diejenige von der Substruk- 
tur mit niedrigerer (h5herer) Numerierung (210, 220) (bzw. 220, 230) zu der Substruktur mit der faBheren 
(niedrigeren) Numerierung (210, 220) (bzw. 220, 230) ist, konsistent fur afle der einen oder mehreren anarysierten 
molekularen Strukturen 200. Erne alternative Konvention fur die Rkhtnng basiert auf den Bezeicfanungen der 
Atome (Plaize) an den Endpunkten einer drehbaren Bindung: Es wird angeuommen, daB die Richtung von dem 35 
Atom (dem Platz) rait der niedrigeren (hdhcrcn) Numerierung zu dem Atom (dem Piatt) mit der hdheren 
(niedrigeren) Numerierung veriauft, konsistent fflr alie der einen oder mehreren analysierten molekularen 
Strukturen 200. 

Eine gegebene molekulare Struktur 200 kann mehr ate eine drehbare Bindung 218a (bzw. 218b) enthahen und 
kann somit uber Drchungen um diese Bindungen 218a (bzw, 218b) herum jede beliebige einer mdglfcherweise 50 
unendlichen Anzahl von Konflgurationen (200, 250) annehmen. Molekulare Strukturen 200 mit einer oder 
mehreren drehbaren Bindungen 218a (bzw. 218b) werden als IconformatkmsflexiW molekulare Strukturen 
oder^onformationsflexible" MolekQle bezeichneL 

Es ist zu erwahnen, daB die molekulare Struktur 250 eine weitere Konformation der molekularen Struktur 200 
ist(undimigekeIm\a^siediegleichemolrfniIare Struktur ist wobei (a) ihre starren Substnikturen(210,220)um 65 
die drehbare Bindung 218a relativ zueinander gedreht sind 215a und (b) ihre starren Substnikturen (220, 230) um 
die drehbare Bindung 2t8b relativ zueinander und unabhangig von der Rotation in (a) gedreht sind 215b. 

Alternativ kann eine gegebene molekulare Struktur, 200 keine drehbaren Bindungen (218a, 218b) enthalten, 
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und sie wird dam als cine "starre* molekulare Struktur oder em "starres* Molekul bezeichnet 

ZusatzEch zu der Konformationsflexibilitat einer molekularen Struktur (20ft 250) durch Rotationcn urn ihre 
drehbaren Bmdungen (218a, 218b) herum kann die gesamte molekulare Struktur (200, 250) auBerdem mit drei 
Freiheitsgraden rotieren 290 und sich mit drei Freiheitsgraden in dem globalen Koordinatensystem 235 verschie- 
ben29& 

Zusatzlich zu dem globalcn Koordinatensystem 235 kdnnen anfierdem "lokale* Koordinatensysteme 245 
durch geeignetes Auswahlen eines kleinen Satzes von Atomplatzen (z. & I, K, H) in der molekularen Struktur 
(200, 250) erzeugt werden. Zum Beispiel k6nnen, wenn die drei Atomplatze 1, K und H (die so gewahlt sind, daB 
sie nicht kolfinear sind) in der molekularen Struktur (200, 250) gegeben sind, die Vektoren i=i-*H und j=I-*K 
erzeugt werden. Da angenommen wird, daB die drei Punkte nicht kolfinear sind, ist das Kreuzprodukt k=i x j 
der zwei Vektoren i und j wohldefiniert und senkrecht zu der Ebene, die durch die Vektoren i und j definiert ist 
Die Enhritsvektoren ul, u2 und u3 entlang der Richtungen, die durch die drei Vektoren i, j beziehungsweise k 
definiert sind, defmieren ein schkrwinkliges lokales Koordinatensystem 245. Dieses Koordinatensystem 245 wird 
als "schiefwinklig" bezeichnet, da die Einheitsvektoren i und j im aligemeinen Fall nicht orthogonal zueinander 
sind Es ist jedoch raogGch, daB die erzeugten sdriefwinkBgcn lokalen Koordinatensysteme 245 ans Einheitsvek- 
toren ul und u2 bestehen, die orthogonal zueinander srad 

Es ist zn erwShnen, daB, wie oben bescbrieben, ein scMerwinkliges lokales Koordinatensystem 245 durch 
Auswahlen einer (oder b eider) der Atomplatze, welche die drehbare Bindung 2 18a definieren, D oder G (oder D 
und G) und von zwei (oder einer) der restlichen Atomplatze der gegebenen Substruktur (210, 220) erzeugt 
werden kann. Zum Beispiel: ein schiefwinkliges lokales Koordinatensystem 245 fur die Substruktur 210 kann 
durch Verwenden von einem der Atomplatze H, I, J, K, L> M, N, O, P und sowohJ D als auch G definiert werden. 
Aquivalent kann ein schiefwinkliges lokales Koordinatensystem 245 fur die Substruktur 220 durch Verwenden 
von zwei der Atomplatze H t I,J,K,L>MN i O,P und genau einem von D, G definiert werden. In einer ahnlichen 
Weise kdnnen ein oder raehr scUdrwinklige lokale Koordinatensysteme 245 fur die Substruktur 210 gewahlt 
werden. Eine analoge Beobachtung kann fur die schiefwmkligen lokalen Koordinatensysteme 245 gemacht 
werden, diw erzeugt werden, daB sie Atomplatze von den molekularen Snbstrukturen (220, 230) und der 
drehbaren Bindung 21 8b bemhalten. 

Das globale Koordinatensystem 235 ist von den schierwinkligen lokalen Koordinatensystemen 24% die man 
erzeugen kann, verschieden, da die Position und Orientierung des schierwinkligen lokalen Kbordinatensystems 
245 in dem globalen Koordinatensystem 235 variieren kann, wenn das jeweilige Molekul 200 starre Transforma- 
tionen (Drehungen 290 und Translations 295) erfahrt Die gleiche Aussage gilt, wenn eine starre Gruppe (210, 
220, 230) in der molekularen Struktur (200, 250) relauv zu einer anderen starren Gruppe (210,220, 230) urn die 
drehbare Bindung 218a (bzw. 218b) herum rotiert 215a (bzw. 215b), welche die zwei starren Gruppen 210 und 220 
(220 bzw. 230) verbindeL 

Es ist zu erwabnen, daB ole Vektoren 238 und 248 so definiert warden, daB sie bezuglich der starren 
Substruktur 220 starr angeordnet sind, und somit auch das ausgewahlte schiefwinklige lokale Koordinatensy- 
stem 215. Des weiteren befinden sich die Vektoren 238 und 248 stets in einer festen Position und Orientierung in 
bezug zueinander. Von diesera Punkt an werden die zwei Vektoren 238 und 248 als das "magisehe Vektorpaar* 
bezeichnet, das mit der molekularen starren Substruktur 220 verknupft ist Jede molekulare starre Substruktur 
210, 220, 230 eines gegebenen MolekOls 200, 250 besitzt ein magisches Vektorpaar, das mit derselben verknQpft 
ist Jedes der Hemente des magischen Vektorpaars (d h. 238 und 248) wird als ein 'magischer Vektor* bezeich- 
net Wie ber etts oben angedeutet, bTaucht ein magischer Vektor, der mit einer gegebenen Substruktur verknupft 
ist; nicht notwendigerweise in Form einer der drehbaren Bmdungen definiert zu sein, die von der betrachteten 
Substruktur ausgehen. Im folgenden kann der Ausdruck magisches Vektorpaar (bzw. magischer Vektor) aus- 
tauschbar mit dem Ausdruck Ref erenzvektorpaar (bzw. Ref erenzvektor) verwendet werden. 

Im aligemeinen Fail wird angenommen, daB die zwei Vektoren 238 und 248 nicht koDinear sind und somit ein 
Koordinatensystem erzeugen, das als das "magische Koordinatensystem" 255 bezeichnet wird. Es kann ange- 
nommen werden, daB das magische Koordinatensystem (m Fig. 2B gezeigt) seinen Ursprung O"' im Schwer- 
punkt der vier Endpunkte (zwei Anfangs- und zwei Endpunkte) der zwei magischen Vektoren hat; die Hauptach- 
sen C"x und 0"'y des Koordmatensystems sind durch Translation der Vektoren 238 und 248 derart definiert, 
daB ihre Ursprunge mh dem Ursprung Of" zusammenfallen Da angenommen wird, daB die zwei Vektoren 238 
und 248 nicht koDinear sind, ist ihr Kreuzprodukt wohldefiniert und bestimmt die dritte Hauptachse 0"'z des 
magischen Koordmatensystems, Da die Vektoren 238 und 248, die das magische Koordinatensystem defmieren, 
nicht notwendigerweise orthononnal sind, solite es klar sein, daB im aligemeinen Fall das magische Koordinaten- 
system 255 etn schiefwinkliges sein wird Es solite auBerdem erwahnt werden, daB sich das magische Koordina- 
tensystem 255, das mit einer starren Substruktur 220 verknOpft ist, stets in einer festen Position und Orientierung 
bezuglich der lctztcrcn befindet und sich somit zusaramen mit der starren Substruktur 220 bewegt, wenn die 
Substruktur Rotatlonen und Transladonen in dem globalen Koordinatensystem 235 erfahrt; dies ist das Ergebnis 
davon, daB das magische Koordinatensystem 255 konstruktkmsgemlB starr an die starre Substruktur 220 
angebunden ist Dasselbe gilt fur das schiefwinklige lokale Koordinatensystem 245: aufgnmd der Weise, in der es 
konstrtdert ist befindet sich das magische Koordinatensystem 255 stets in einer festen Position und Orientierung 
bezuglich des schierwinkligen lokalen Koordinatensystems 24* SchlieBlich soflte erwahnt werden, daB es unter 
Verwendung des magischen Vektorpaars, das mh einer molekularen Substruktur 220 verknupft ist, eine gauze 
Skala aquivalenter Weisen zum Aufbau eines magischen Koordinatensystems 255 gibt Bevor weitergegangen 
wird, sei in Erinnerung gerufen, daB das schiefwinklige lokale Koordinatensystem 245 unter Verwendung von 
etnigen der Atomplatze der starren molekularen Substruktur 220 erzeugt wurrie. 

Aus dem obigen ist es klar, daB die Position und die Orientierung des magischen Vektorpaars (und somit des 
magischen Koordinatensystems) in dem globalen Ref erenzkoordinatensystem die Position und die Orientierung 
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der stan-en Substruktur, z. B. 220, an die das Paar angebunden 1st. in dem globalen Referenzlcoordmatensystem 
215 unzweideutig bescbreibea „ , 

Sobald ein gegebenes schiefwinkliges lokalcs Koordiaatensystcm 245 unter Vemendung : von Pfitzen von 
einer molekularen starren Substruktur 220 geMdet 1st, kann jeder der Vektoren 238 & 248 des magischen 
Vektorpaars, das mit der starren Substruktur 220 verknupft ist, in dem Koordmatensystem 245 dargesteHt 
werden. Diese Darsteilung kann entweder explizit oder impBzit sein. 

in der expfeiten Darsteilung besitzt der magische Vektor 238 (bzw. 248) eme tote Position und Onentierung 
in dem ausTewablten schiefwinkligen lokalen Koordmatensystem 245. Diese Position mid Onentierung kSnnen 
zum Beispiel in Form eines Transiationsvektors T, der den Mittelpunkt des scmefwinkbgea^alen Koordma- 
SSsySems 245 mit irgendeinem festen Punkt SP entlang der Achse (RicfctungV 217 (bzw 227) des magischen 
Vektors 238 fbzw. 248) verbindet und einer Rotatransmatrix Rbeschrieben werden. Es sollte War sera, daBder 
Punkt SP zum Beispiel einer der Endpunkte D, G (bzw. O, Q) des Vektors 238 (bzw. 248) sein hum Der 
Tramlationsvektor Tgibt die Position des Punktes SP in dem sehiefwmkBgen loteden Kw^tensystemMS 
an, wahrend die Rotationsmatrix R die Orientierung des magiscfaen Vektors 238 (bzw.248) in demgleKhen 
sdWefwinkligen lokalen Koordmatensystem 245 angibt Es ist zu erwataen, daB die Rotationsmatrix durch 
SstoTdeTlJngen der Projektionen des magischen Vektors 238 (bzw. 248) auf me Achsen U und k des 
schiefwinkligen lokalen Koordinatensystems 245 fiquiv^l>es^dben werden ^^^1^ ± 
Rotationsmatrix durch Auflisten der Wmkel beschrieben werden, die der magische Vektor 238 (bzw. 248) nut 
jeder der Acbsen i,jundkdes schiefwinkligen lokalen Koordmatensystems 2*5 emscblieBt AnSerdem k8nnen 
weitere Informationen, z, B. die IdemMt der drehbaren Bindung 218a (bzw 218b) -- m <^ Fafi,daB der 
magische Vektor in Form einer derartigen drehbaren Bmdimg defmiert ist oder die GrdBe V^2^ (few. 
2481 in der Darsteilung enlhalten sein; diese zusStzlichen Informationen kOnnen ffir Venfiimtionszwecke ver- 
wendet werden: zum Beispiel znr Bestimmung tier Position einer der zwei anderen Subslrokturen 210, 230 
bezflglich des schiefwinkligen lokalen Koordinatensystems 245. In dieser Erorterung wurde angenommen, daB 
allenBindungen der betrachteten molekularen Struktur eindeutige Bezeichnungen gegebeii wurden. 

Die Grofe Position und Orientierung der magischen Vektoren 238 & 248 konnen durch deine gerrngfOgige 
Modifikation der homogenen 4 x 4-Transformationsmatrix, die auf dem Geb.et von Compntergrapmkai weit 
verbreitet ist, kompakt in einer Matrix* orm dargesteHt werden. Insbesondere kann die mod^erte Trajisforma- 
tionsmaSx, wie das folgende Diagramm anzeigt durch Verwenden der oben erwitoto. 3 ^tobonsmamx 
R, des 3 x liTransktionsvektors T und der Langender3 Projektionen des Vektors 238 (bzw. 248) auf die Acbsen 
U und k des schiefwinkligen lokalen Koordinatensystems 245 auf gebaut werden: 



Proj ek ti onAufl . 
ProjektionAufJ R 
Proj ekti onAufK 

T 1 



to 
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Klarerweise gibt es zwei derartige Matrizen. eine for jedes der zwei Vektorelemente des magischen Vektor- 

P5 fcder impliziten DarsteUung konnen die Position und Orientierung des magischen Vektorpaars (d .h. der 
Vektoren 238und 248) in dem ausgewahheu scmefwtnkiigen lokalen Kcwrdmatensystem 245 durch AufEsten der 45 
identifizierendeii Bezeichnungen der Atomplatze, die beim Definieren der magischen Vektoren hdfei^angege- 
SS^Szun rSSitonnen in dem Fall, in dem die magischen Vektoren 238 und 248 fur die starre 
Substruktur 220 mit HWe der drehbaren Bindungen 218a & 218b defmiert werden, die Bezeicbimn|en D/G und 
oX^wwendet werden: die Bezeichmmgen and in der Remenfolge aufzubsten. welche die RKhtung der 
entsprechcnden Vektoren 238 & 248 defmiert Im impliziten FaU werden die Position imd Onentterung des so 
magischen Koordinatensystems 255 von den Bezeichmmgen der defintaenden AttnpBtte D/G, OJ und der 
Beschreibung der molekularen Struktur 200 erzeugt wann immer, eme derartige Information imer Position und 
olSeWnotwendig ist Jegliche weitere Information, wie im Fall der explmten DarsteUung erkutert, kann 
o^O^ne-Xredmnng erSlten werden. Daher kann die implizite DarsteUung die Speicheranforderungen in ^ 

^SderdlSSj Oder die expUzite Darsteilung der ^^Jf^^Z^^^ 
ausgewiblten schiefwinkligen lokalen Koordmatensystem 245 gegeben, gamgt dies, um die Poauon und On»- 
Sns der Elemente des magischen Vektorpaars in dem globalen Koordinaten$ystem235 zu bestimmen. Wie 
jeSotei erliutert wurd^eme Bestimmung der Position und Orientienmg der Herne^ des inagi^en 
Vektorpaars In dem globalen Koordmatensystem 235 sofort die Position und Onentienmg (d h. die Pfennig) 60 
der entsprechenden starren Substruktur 220 in dem globalen Koordmatensystem 235 fest und spezrfizicrt diese 

V °S£ erwlhnt genflgt die Definition der Koordinaten(x,y,z) von drei oder mehr Atomen (Flatten) (^ B. 
G-P)tmCTgSben« ^tarr^ Substruktur 220 in dem globalen Koordmatensystem 235, um ^schdwrnkkges 
Se^rXSSr^45 eSwIe erne globate Position und eine gfotale Orientierung furd» starre es 
^Sik^2» indem gtobalen KoordinatensysTem 235 m definieren. Demzufolge genttgt de Defmbonder 
SmaVSy 2)von drei oder mehr Atomen (PStzen) (z. B. G-P) einer gegebenen starren Substruktur 220 m 
Sn^fflltoKSSJSl 235, um die Position und Orientierung des magischen Vektorpaars m dem 
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globaien Koordinatensystem 235 zu definieren. Dies wird dadurch erreicht daB entweder die implbdte oder die 
explizite Darstellung der Vektoren 238 und 248 in dem schiefwinkligen lokalen Koordinatensystem 245 verwen- 
dct wird und eine Anderung der Koordmatensysteme durch bekannte Vektortechniken auf das globale Koordi- 
natensystem 235 angewendet wird. In ahnlicher Weise reicht die Definition der Koordinaten (x, y, z) von drei 
oder mehr Atocien (Piatzen) einer gegebenen starren Substruktur 210 (bzw. 230) in dem globaien Koordinaten^ 
system 235 aus f urn die Position und Orientierung des Vektors 238 (bzw. 243) in dem globaien Koordinatensy- 
stem 235 zu defxnieren. 

Wie fruher angegeben, besitzt die molekulare starre Substruktur 220 em mit ihr verknOpftes magisches 
Yektorpaar. Entsprechend unserer Beschreibung des magischen Vektorpaars and wenn seine beteiligten Vekto- 
ren mit Hilfe von drehbaren Bindungen beschrieben werden, beinhalten die rait den Substrukturen 210 und 230 
(die mit der starren Substruktur 220 verbunden sind) verknupften magischen Vektorpaare die Vektoren 238 
beziehungsweise 248. In diesem Moment bleibt die Identitat des zweiten Vektors des mh den Substrukturen 210 
beziebongsweise 230 verknupften magischen Paars unspezifiziert Unten wird gepruft, wie die magischen 
Vektorpaare definiert sind, wenn eine Substruktur nicht wenigstcns zwei drehbare Bindungen aufweist, die von 
ihr ausgehen. Wenn die Position und Orientierung der Kemente des magischen Vektorpaare fur die Substruktur 
220 in dem globaien Koordinatensystem 235 bestimmt sind, sind die Position und Orientierung der Substruktur 
220 in dem globaien Koordinatensystem 235 voustlndig festgelegt, wahrend gleichzehig die Position und 
Orientierung der Substrukturen 210 und 230 stark etogeschrankt sind. Tatsachlich eriaubt die Kenntnis der 
Plazierung der starren Substruktur 220 in dem globaien Koordinatensystem 235 und die Information uber die 
drehbaren Bindungen, die von dieser ausgehen, die Bestimmnng der Position und Orientierung der drehbaren 
Bindungen 218a und 218b in dem globaien Koordinatensystem 235, wie vom Standpunkt der starren Substruktur 
220 aus gesehcn. In annlicher Weise eriaubt das magische Vektorpaar, das mh der starren Substruktur 210 
verkntipft ist, die Bestimmnng der Plazierung der Substruktur 210 in dem globaien Koordinatensystem 235 und 
somit die Bestimmung der Position und Orientierung der drehbaren Bindung 218a, wie vom Standpunkt der 
starren Substruktur 210 aus gcsehea Die zwei Berecbnungen mussen jedoch unabhangig davon, von welcher 
starren Substruktur der Standpunkt zur Bestimmung der Position und Orientierung der drehbaren Bindung 218a 
in dem globaien Koordinatensystem 235. verwendet wurde, fiber einsthnmen, wenn die starren Substrukturen 
Tea einer zutreff enden Anordnung der molekularen Struktur 200 sein soUen. Analoge Kommentare konnen fur 
die drehbare Bindung 218b und die starren Substrukturen 220 und 230 gemaeht werden. Diese Einschrankung ist 
wahrend der letzten Phase des Vergleichsprozesses 600 (siehe Beschreibung unten) sehr nutzlich, da sie es 
eriaubt, hypothetische Plazierungen for eine gegebene starre Substruktur 220 auszuscheiden, wenn diese nicht 
durch hypothetische Plazierungen von starren Substrukturen 210 und 230, die durch eine drehbare Bindung mit 
der starren Substruktur 220 verbunden sind, bestatigt werden. 

Eg. 2C bt eine DarsteDung, die eine zweite molekulare Kotrfonnadon 250 der molekularen Struktur 200, das 
globale Koordinatensystem 235; das sduefwinkBge lokalc Koordinatensystem 245 und die mvarianten Vektoren 
238 und 248 von Fig. 2A zeigt 

Der Ansdruck Konformation wird verwendet, urn irgendeine eines Satzes von mdgfichen K^nfigurationen un 
dretdimenskmalen Raum zu bezeichnen. die eine gegebene molekulare Struktur (200, 250) aufgrund einer 
inharenten strukturellcn FlexibiBtat annehmen kann; diese FlexibiLitat ist typischerweise die Folge von drehba- 
ren und/oder flexiblen Bindungen, die in dem MoLekftl exisderen. Die Analyse hierin konzentriert sich lediglich 
auf drehbare Bindungen und nimmt an, daB die gezeigte strukturelle HcxibuMt das Ergebnis von Drehungen 
starrer Substrukturen urn derartige drehbare Bindungen herura ist Typischerweise gibt es unendlicb viele 
derartiger Konfigurationen, wobei einige von Omen energetisch gunstiger als andere sind. AuBerdem kSnnen 
sterische Betrachtungen den Satz moglidier KpnTorraationen weiter begrenzcm ^ 

Wie oben beschrieben, bleiben in jeder Konformation 250 der molekularen Struktur 200 die Position und 
Orientierung der drehbaren Bindung 218a (bzw. 218b) in bezug auf ein schiefwinkliges lokales Koordinatensy- 
stem 245 entweder der Substruktur 210 oder 220 (bzw. 220 oder 230) die glefchen (invariant). In annlicher Weise 
bleiben die Position und Orientierung der drehbaren Bindung 218a (bzw. 218b) in bezug auf ein scWefwinkBges 
lokales Koordinatensystem 245 entweder der Substruktur 210 oder 220 (bzw. 220 oder 230) die gieichen 
(invariant), worn sich die gesamte molekulare Struktur 200 dreht und in dem globaien Koordinatensystem 235 
verschiebt Dies Uegt an der Tatsache, daB das schierwmkiige lokale Koordinatensystem 245 und die drehbare 
Bindung 218a (bzw. 218b) stets in einer festen Position und Orientierung relativ zuehander liegen, ungeachtet 
jegBcher Rotation 215a (bzw. 215b) der starren Substruktur 220 urn die drehbare Bindung 218a (bzw. 218b) 
herum und jegficher Translation 295 und/oder Rotation 290 der gesamten molekularen Struktur 200 oder Jeder 
ihrer Konformationen 250. 

Um einen Satz beschreibender Indizes fur die molekulare Struktur (20ft 250) zu erzeugen, mussen Tupel von 
Atompiatzen (und/oder Thimmy'-PIatzen, unten beschrieben) gewahlt werden. Diese Tupel konnen zur Btldung 
des schiefwinkligen lokalen Koordinatensystems 245 verwendet werden. Die Tupel beshzen Tur^-Eigenschaf- 
ten, die unter anderem geometrisdie Merkmale, Ordnungs- und Vektorbeziehungen beinhalten konnen, die 
durch die Atomplatze, die das Tupel beinhahet (siehe Beschreibung von Rg. 3), definiert sind. 

AuBerdem konnen ein oder mehrere Satze von Atompiatzen (und/oder T^mnmy'-Watzen^ zum Beispiel der 
Ring K-P, in der molekularen Struktur (200, 250) als 'Charakteristika' aufweisend identifinert werden. Diese 
Oiarakteristam sind fur den Satz von Atompiatzen K-P spezifisch und konnen umfassen: chemische (z.B. 
Valenz, Atomgewicht, Atomtyp eta) und/oder physikalische (z. B. elektrostatische, hydropathische eta) Sgen- 
schaften des Safzes von Atompiatzen, weitere Eigenschaften eta Im folgenden werden diese SItze von Atom- 
piatzen K-P als Tlatzsatze' bezeichnet 

Daher konnen, wenn ein oder mehr der Atomplatze, die an einem Tupel teilhaben, auch ein Element von emem 
oder mehr der Platzsatze sind, die Charakteristika der Platzsatze, von denender Atomplatz in dem aixsgewghlten 
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Tucct ein Element ist, audi mit dem Tupel verknupft sein. Somit kOnnen diese Charakteristfea dazu verwendet 
W e^en.denYondemTupdabgelettetentodexzuvergT©Bemurri 

Die Position und Orientiening der magischen Vektoren 238 und 248 sind m jedem der scwefwinkbgen lokalen 
Koordinatensysteme 245, die unter Verwendung von Ptatzen von der Substruktur 220 erzetigt werden, darge- 
stellt: die Darstellung der Vektoren 238 und 248, invariant in jedem der scmefwmkligen lokalen Koordmatensy- s 
stone 245, ist fiber erne Datenstruktur (siehe Beschreibungder Kg. 4 und 5 unten) nut dem Index verknupft, der 

V °Ht!? ^etiffSlen^von Zeichnungen, die zdgen, wie Platzsatze K-O defiriert werden (Rg.3Ai wis 
Duinmv-Platee Du definiert und dann verwendet werden (Fig. 3B) und wie Tupel (^ischerweise 335, 345,355) 
duidiWahleneinesSalzesvonememodermebrAtomplatzenimdVoderDim^ io 
ren Struktur 200 definiert werden. Jedes Tupel (335, 345, 355) wird dazu verwendet em spezmscnes sclnefwmk- 

^^Pfates^b^nTsa^Xerebaier mebr Atwmilatze und/oder ein oder mehr Dummy-PlStee der molekula- 
ren Struktur 200 bemhaltet Ein Beispiel fur einen Platzsatz kann eine aflgemem anftretende Struktur (Z.B. em 
Phenvlrinz oder der Ring K-O) in einer Datenbank, D, aus molekularen Strukturen 200 sem. Manchmai istes is 
natzlkh, eine derartige Struktur durch einen einzelnen Dummy-Plate Du zu erseteen. Ein ahernatover Weg zur 
Defiaition ernes Platesatzes besteht dark, Atome auszuwahlen, die einen gernemsamen Sate yon aaraktenstika 
und/oder Eigenschaften teUea Zum Beispiel kann man einen Platzsatz durch Sammeto aller der Atomp atee 
eraugen, die an elnem aromatischen Ring teifliaben. Ein weiterer Platzsatz kaon durcb S^eta aBjener Platee 
Sit werden, die als Wasserstoff-Donatoren (bezfehungsweise Akzeptoren) wken. D.ese Platte konnen 20 
Sd^hdneD^ 

kades Platzsatzes Qbeniimmt,derenetet wirdZum Beispiel istiuHg. 3Ader Pktesate K-O anden Atomplatz P 
gXndeaA^emeidsuertd^ 

K-O durch die Dummy-Einheit Dn (Fig. 3B) ersetet wird, ist es die Dummy-Einhett . anstefle des Plateatz* K-O. 
die nun an den Atomplatz P gebunden In einer analogen Weise wird nun Ae ^^Bmdimg OQ * 
Bindung ersetzt, wetehe die Dummy-Enheit mit dem Plate Q in der Subsjrukmr 230 verbmdet Aufierdeia 
ttbwnunmt die Dummy-Einheh Du, weno der Platzsatz K-O Charaktenstika besitzt (z.B. hydropathisches, 
bestimmtes eiektrostatisches Verhalten etc.) auch diese Charakteristika. _ _ t 

Ein TupeJ ist ein Sate von eiaem oder mehr Atompfcteen und/oder emem oder mehr Duinmy-Rateenjupel, 
dieledigucn^enAtom-(oderDun^^^ 30 
starren Struktur nutzHch. In derartigen Fallen kann eine Bestnnnnmg von Information fiber die Rotation 290 
eine zusStetiche berechnungsmaflige Belastung nach sich ziehen. Des werteren konnen Informationen zur 
Erzeugung von Indizes auf die Charakteristika des einzelnen Atom-(oder Ehimmy-)Platzes in dem Tupel be- 
SttTem. In Shnlicher Wdse sind Tupel. die ledlglich zwei Atom-(oder l^y-)P^ bemhaltea be. der 
Beschreibung von Translationen 295 einer starren Struktur nntziich, und sie kSimen audi die Rotation 290 auf 35 
OTeiFreSgrade beschranken, spezifizieren die Rotation jedoch meat voUstSrxHg: erne Be sttmrnung von 
Wonnatfonu£rdieRotadon290^ 

kflnnen Informationen zur Erzeugung von Indizes auf die CharaktensUka der zwel Atom-(oder Dummy-)PlItee 

" BTd^bloS^iuSabrungsform werden Tupel unter Verwendung von drei oder mehr Atom-Jund/oder 40 
Dummy-)Platzen definiert Bei einer bevorzugtcren Ausfuhrungsfonn sind wemgstens ^Mom+^oter 
Dummy- PlaUe das Tupels nicht kollinear. Die Tupel werden dazu verwendet. em sduefwinkhges tokates 
Koordkiatensystem 245(wie oben beschrieben) und einen Index zu defimeren. Wctrn das Tupel vier Atom-(uiid/ 
Oder Dummy-)Platze beinhaltet, von denen jewefls drei mcht kollinear and, dam kann das Kreuzpiodukt 1 x j 
(oben b3eben) durch den Vektor ersetzt werden, der den Ursprang des schiefwinkligen lokalen Koordma- 45 
tensystems 245 mit dem vierten Platz verbindet f „, 

Esht zuerwShnen,daB vier oder mehr Atom-fund/oder Dummy-)Platee verwendet werden konnen. In diesera 
Fall kStmen jeweils drei nicht kollineare Atom-(und7oder Dummy-JPlatee ausgewahlt werdeaum das sckef- 
winkltge lokale Koordinatensystem 245 zu bestimmen, wShrend die restfichen Aton>(und/odcr Dummy-)Platee 
cSverwaxlet werden konnen, die wShrend der Vergleichsstufe des Verfahrens erzeugten Hypothesen wetter so 
einzusdiranken. Siehe Beschreibung von Fig. 6 unten. j. ,„„ 

Man beacfate, da6 keine, einige oder alle dieser Eigenschaften und Charaktenstika dazu verwendet werden 
konnen, eine Zahl (einen Index) zu bilden, der die erzeugten Dreiecke, die den Tupeln entsprechen. emdeung 

b Ke^schen Vektoren 238 und 248 sind Starr in dem sdriefwinldigen Iok^Koordinateusystem 245 55 
angeordnetdas unter Verwendung von PBtzen von der Substruktur 220 gebHdet wurde, wie oben bwenneben. 
DiTmagischen Vektoren 238 and 248 werden dann (tap&zit oder erpfizit, wie oben beschneben) m dem 
schiefwinkligen lokalen Koordinatensystem 245 des gebudetenDreiecks300 dargestellt. 

Tunel werden wahrend der Durenfuhrung von zwei Prozessen, die in dieser Erfmdung ; enthrften sin* gebUoet: 
ememReferenzspdcherprozeB (siehe Fig. 5) und emem VergleicbsprozeB gehe Fig. 6> In dem ReJerenzspei- 
cherprozeB werden Tupel durch Auswahlen von Atom<und/oder DujnrayOP&tom ^ausder ^olekular^ Souk- 
tur (200, 250) gebildet Wahrend des Referenzspdcherprozesses werden die Tupel durch Auswahlen ausemem 
Sate von Atom-(und/oder Dummy-)Piatzen. ReFerenztupel-Auswahlsatz genannt, gebildet Der Referenztupel- 
AWahlsatz belhahet alle Atonjatze in einer S tarren Substruktur («0. 220, 230VaDe ^^^^jf 
einer starren Substruktur (210, 220, 230) verknupft, sind, und die Atom-(uiid7oder J*^"^^*^™ 
Richer drehbarer Bindingen 218a und 218b rind, die an dte gegebene starre Substruktur 1™;^™*) 
anjebunden, jedoch nichtto der Substruktur (210. 220, 230) enthalten smd. Der ^F^^^S" 
Stet diesc Atom- (und/oder Dummy-JPlatze, da Tupd. die einen oder mehr dieser Platee enthslten. 
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invariant bleiben, ungeachtet der Rotation 215 ran Lrgendwelcfae drchbaren Bindungen 218a und/oder 218b 
herum Dies Kegt daran, wie oben erlautert, daB die Position und Orientienmg der drehbaren Bindung 218a (bzw. 
218b) in bezug auf das schiefwinkiige lokale Koordinatcnsystem 245, welches von dera Tupel definiert wird, 
gleich (invariant) bleiben, wenn die starre Substruktur 220 bezugfich entweder der starren Substruktur 210 oder 
der starren Substruktur 230 rotiert Es bt des weheren zu erwahnen, daB die Position und Orientienmg der 
drehbaren Bindungen 218a und 218b in dem schierwinkligen lokalen Koordinatensystem 245, welches von dem 
Tupel definiert wird, invariant sind, ungeachtet jegKcher Rotation 290 und Translation 295 der molekularen 
Struktur (200, 250). In einer bevorzugten Ausfuhrungsform konnen die Tupel aus e in era geeigneten Subsatz des 
soeben definierten Ref erenztupel-Auswahlsatzes gewahJt werden. 

Wahrend des Vergleichstestprozesses werden die Tupel durch Auswahlen aus einem Satz von Atom-(und/ 
oder Dummy-jPlStzen gebildet, welcher der ^ergleichstupel-Auswahlsatz' genannt wird. Anders als bei dera 
Referenztupel-Auswahisatz kann der Vergleichsmpel-Aiiswahlsatz aHe Atom-<und/oder Dunimy-)Platze der 
gesamten molekularen Struktur (200, 250) beinhalten. Bei einer alternativen bevorzugten Ausfuhrungsforra 
konnen Subsatze aller cfieser Platze verwendet werden, urn den Vergleichstupel-Auswahisatz zu erzeugen. Bei 
einer bevorzugten Ausfuhrungsforra bVmhalten die AtomplStze sowohl in don Ref erenztupel-Auswahl- als auch 
dem Vergleichstupel-Auswahisatz keine Atom- (und/oder Dummy-) Pfttze, die zu weit vonednander entfernt 
smd (z. B. tnehr als 10 Angstrom entfernt). 

Die Erfindung erzeugt eine Mehrzahl von Tupeln sowohl in dem Referenzspeieher- 500 als auch dem 
VergleichsprozeB 6(KX Bel einer bevorzugten Ausruhrungsform werden so viele Tupel wie mdglich durch 
Verwendendes Referenztupel- Auswahlsatzes (oder des Vergleichstupel-Auswahlsarzes) erzeugt In einer werte- 
ren bevorzugten Ausftthrungsform werden alle mQglichen Tupel erzeugt; die durch diese Tupelauswahlsatze 
impliziert sind. Bei einer wcitcren bevorzugten Ausfuhrungsform werden alle moglichen Tupel rah Ausnahrae 
redundanter Permutationen der Tupelmitgheder erzeugt die durch diese Tupelauswahlsltze hnpliziert sind 

Fig; 3C ist eine Darstellung der Substruktur 220 mit angebundenen drehbaren Bindungen 218a und 218b und 
der Rragstruktur K-O, die durch den Dummy-Platz Du dargestcllt ist Ein Tupel 335 wird durch Auswahl von drd 
Atomplatzen H, I, J aus dem Ref eraiztupel- Auswahbatz gebikfet, der den Satz von Atomplatzen D, G, H, I, J, P 
und den Dummy-Platz Du bcinhaltet Das Tupel 335 definiert ein Dreieck 336 mit Egenschaften, die folgendes 
umfassen: geometrische Merkmale (z. B. die Langen der drei Seiten des Dreiecks 336, die Winkel des Dreiecks 
33& den Uraf ang des Dreiecks 336 etc), Ordnungsinformation (die durch {Convention aus der Reihenfolge, in der 
die PUltze ausgew&hlt werden, impliriert ht\ Vektorinformation eta Zum Beispiel ist, wenn die Atomplatze in 
der Reihenfolge H, I, J ausgew§hlt werden, der Vektor i (siehe Erdrterung oben) alsl *» H-*l defmiert, und der 
Vektor i (siehe Erorterang oben ) ist als i = H J defmiert; diese Konyention wird durch den ganzen 
beschriebenen ProzeB faindurch konsistent verwendet Andere Konventionen sind moglich. Ahernativ ist, wenn 
die Atomplitze in der Reihenfolge I, H, I ausgewihlt werden, der Vektor i (siehe Erdrterung oben) als i = 1-*H 
defmiert, und der Vektori (siehe Erortenmg oben) istalsi = I J definiert In beiden Pollen ist der Vektor k als 
k m i x j defmiert, wie oben beschrieben, und die Vektoren i, i, k defmieren das scUefwinklige lokale Koordina- 
tensystem 245, das mit dem Tupel 335 verknflpft ist 

Wenn eine gegebene Anzahl, z.B.3, von Atomplitzen aus dem Referenztupel-Auswahisatz ausgewthlt wird, 
ist mehr als eine Tupelreihenfolge mdglich. Mit anderen Worten konnen die ausgewShhen Platze, die das Tupel 
bilden, permue'ert werden, um weitere Tupel zu bilden. Zum Beispiel konnen die ausgewahlten Atomplatze H, I, 
J Tupel 335 wie Folgt bilden: H-I-J, H-Jl I H-J, I-J-H, J-I-H und J-H-L Im augemeinen ist die Anzahl von 
geordneten Tupeln, die durch Auswahl von k Piitzen aus einem Rcfcrcnztupel-Auswahlsatz erzeugt werden 
konnen,derl Platze enthalt, durch !!/(!— k)!gegeben. 

Tupel 335, die Permutationen vonemander sind, defmieren jedoch die gleichen georaetrischen Eigenschaften, 
Z.B. die Langen der Seiten des Dreiecks 336 etc Daher sind in einigen bevorzugten Ausnahrungsformen 
redundante Permutationen einer gegebenen Anzahl von Piatzen, die ein Tupel bilden, nicht notwendig. Dies liegt 
daran, daB alle Permutationen eines gegebenen Topels 335 den gleichen Satz von Atomplatzen bemhalten und 
daher die gleichen geometrischen MerJonale und Vektorinformationen tragen. 

Ordnungsmformationen kdnnen auch erhalten werden, wenn eine Ordnungskonvention anferlegt wird: Alle 
Permutadonen eines gegebenen Topels 335 kdnnen aus einer emzigen normierten Form des Tupds 335 outer 
Verwendung der Ordnungskonvention erzeugt werden. Daher genfigt es, lediglich ordnungsfreie Kombinano- 
nen von Atomplitzen von der molekularen Struktur (200, 250) zu berOcksicbtigen; die Anzahl mSglicher 
(ordnungsff eier) Kombinationen, die durch W3Meu von k Platzen aus einem Referenztupel-Auswahisatz, der 1 
Platze cnthalt, erzeugt werden kann, ist durch l!/(IO(I— k)t) gcgeben, was um einen Faktor k! kleiner als die 
Anzahl geordneter Tupel ist DemgemaB sind die Speicheranforderungen um- den gleichen Faktor reduziert, bei 
einer niinimalen Znnahme der berechnungsmiBigen Kosteo, die zur Ausfuhrung der notwendigen Verwaltungs- 
operanonen notwendig sind . 

Der ProzeB des Auswahlens eines einzdnen reprasentativen ordnungsfreien Tupels (« emer Kombmauon) 
wird 'Nornuerung' genannt Eine Normierung beinhaltet eine Bestimmung einer eindeutigen Ordnung, wenn ein 
Satz von Atomplatzen gegeben ist; die auferlegte Ordnung ist unabhingig von der Reihenfolge, in der die 
Atomplatze gegeben sind. Dies wird durch Auf erlegen einer Ordnungskonvention bewerkstefligt, um ein einzel- 
nes reprasentatives 'normiertes' Tupel bei einem gegebenen Satz von Atomplatzen auszuwahlen. Die Atomplit- 
ze werden geraSB einer bevorzugten Ordnungskonvention dadurch geordnet, daB zuerst die aktuellen Langen 
der Seiten der Form bestimmt werden, die durch Verbinden der ausgewahlten Platze erzeugt wird Es sind auch 
andere Ordnungskonventionen moghch. Der crste und zweite Platz in der Reihenfolge sind jene Platze, die am 
wehesten entfernt sind und die langstmdgHche Serte eines Polygons bilden, das jeden der ausgewahlten PUltze 
als einen Vertex besitzt Der dritte Platz in der Reihenfolge ist der Platz, der am weitesten von jedem der ersten 
beiden Platze entfernt ist und die nichstlangste Seite des Polygons Kldet Der zweite Platz in der Reihenfolge 
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wird dann der Plata an dera Vertex, an dem sich die zwei zuvor gebildeten Seiten schnddea Der erste Plate in 
der Reaienfolge wird dann der andere Platz auf der lSngstmoglichen Seite. Das Ordnen wird fortgesetet durch 
W5hlen des vierten Platzes ais jenem verbliebcncn Atomplatz, der den weitesten Abstand von dem dntten Plate 
hat, des funften Platzes als dera verbliebenen Atomplatz, der am weitesten vondem vierten Plate entfernt ist und 
so wetter, bis allePlatze des Tupeb 335 geordnetsind. . *« 5 

Zum Beispiel kann unter Verwendong eines Tupels 335 aus drei Atomplateen a I und J em Dreieck 336 
eebildet werden, dessen Seiten gemaB der oben bescbriebenen Ordmragskonvennon geordnet smd. Urn dies zu 
bewerlestelligen, bildet der langste Abstand [-J zwischen jeweils zwei der Platee H, I J die langste Seite des 
Dreiecks 336. Die zweiteSeite wird durch den groBten Abstand entwedervonloderjzu dem verbBebenen Plate 
H bestimmt; in diesem Fall 1st dieser Abstand I-H. Als Folge ist der zweite Plate in der Reihenfolge I, da er sich to 
am Vertex befindet, den sich t-J und I-H teilen; der erste Plate in der Reihenfolge ist J, welches den anderen 
Vertex auf der langsten Seite darsteUt; und der dritte Plate in der Reihenfolge ist der als emziges verbEebene 

Es ist zu erwahneo, daB Verbesserungea fur die Konvendon notwendig smd, urn jegiiche adstierenden 
Svmmetrien in dem Polygon zu brechen. Zum Beispiel kann, wenn die Seiten I-H und I-J die gleicfae Lange is 
haben. das Ordnen nicht auf dem Abstand allein baaeren, sondern es si rid writ ere Kntenen zu verwenden. Diese 
Kriterien konnen auf anderen Hgenschaften des Tupels basiereu, wie OrdnungszaMen der Atome an den 
Platzen. chemische Eigenschaften etc. Zum Beispiel ist in dem Fall, in dem I-H und I-J die gleicbe Lange haben, 
der Atomplatz I der Tweite in der Reihenfolge, da er den Vertex darsteUt, d« achdie langste t^ die 
zweitlangste Seite (gleiche Seiten) teilen. Die Reihenfolge der Atomptatze J und H ist jedoch zweideutig und 20 
kann zum Beispiel durch Auswahlen jenes Platzes von J und H mit der hSchsten Oidnungszahl als dem ereten 
Plate in der Remenfolge gelost werden. Abnliclte Oberlegungen kannen in dem Fall verwendet werden, m dem 

d ^^w'das^d3^ 1 noraSert ist; wie oben beschrieben, wird an eindeutiger Index gebildet der das Tup el 
335 reorasentiert Dieser Index kann unter Verwendung einer beliebigen Anzahl von geometrischen Merkmalen, 25 
Egenwhaften der Platee des Tupels. chemischen und/oder physSkalischen Informattonen Ober das Tupel Oder 
die Atomplaae des Tupels eta erzeogt werden. Man nebme zum Beispiel an, daB der Atomplatz J em doppe t 
gebtmdenes Stickstoffatom, I em einfach gebnndenes Kohlenstoffatom und der Atomplatz H em doppelt 
gebundenes KoMeastoffatom sind. Des weiteren ist zu beachten, daB das Dreieck 336 emelang^ Seite imt der 
Lange 11, eine zweitKngste Seite mit der Lange 12 und eke dritte Seite nut der Lange 13 besitet ta ahnbcber 30 
Weise besitzt das Dreieck 336 Winkel 01, ©2 beziehungsweise ©3, die den geordneten Atomplateen J, I und H 
eatsprechea Bei gegebener derardger Information kann em eindeutiger Index unter V^ndung^eroder 
Sder Seiten II Ws I3,keinem oder mehr d^ Winkeiei bis ^^^.^^f^^S^^ 
gen (einfach gebunden, doppelt gebunden etc*, keinem oder mehr der chenuscien Typen (Stockstofi KoHe^off 
etc.) und/oder keinem oder mehr der physikaOschen Eigenschaften (Atomgewicht der Atome an den Hateen, as 
aektronegadvitat eta) eta erzeugt werden, der dieses Tune! J-I-H beschreftt Be. 1 emer b^ugten Ausfflh- 
nmgsfdrm wird der Index durch Verwenden der LSngen 11, 12, des Winkeb ©2 und des Atomtypsdes Atoms am 
zweiten Plate in der Onlnung erzeugt Bei anderen Ausfohrungsfonnen kaimaerwmischt sem^d^dimn jmd 
nwdMn zu erzeugen^ndie Langen 11 und/oder 12 einen bestimmten Schwellwert Qberscfareiteir iind/oder 
der Winkel 62 einen bestimmten Schwellwert uberscnreitet; typische Schwellwerte konnen I Angstr&n fOrme 40 
Langenabmessung und 10 Grad fflr die Winkelabmesstmg sein. SchlieBEch kann es hm undwi^wtoschens- 
wert sein, den Index durch Verwenden der Langen 11, 12 und des groBten Winkeb in dem durch das Tupel 
gebildeten Dreieck 336 zuerzeugen. 

In Anbetracht der obigen Erorterung werden diese Tupel dadurch erzeugt daB der Ref erenzttro^Auswahl- 
satz wihrend des Referenzspeicherprozesses 500 und der Vergieichstupel-Auswahbate wabrend des Vcr- 45 
gtachsprozesses 600 verwendet werden. Bei einer bevorzugten Ausffihrungsfonn wird jede mog^ Kombma- 
don voXteuigten PlStzen in entweder dem Referenztupel-Auswahlsatz oder dem Vergle^^l-Auswahl- 
sate erzeugt Bei ahemativen Ausfuhrungsformen konnen weniger Tupel erzeugt werden. Zum Beispiel wird in 
Flg.3DemTupel345durchAtompiateeLJuimdenDunimy-HatzDugebM 

oben erlautert, und der entsprechende eindeutige Index wird erzeugt In emer ahnhchen Weise wd jedesandere so 
mogfiche Tupel, typischerweise 355 (DOT) in Fig.3E, gebildet nonmert, und em Index wd erzeugt Man 
beachte,daBjeder dieser lndizes fur das zngefaorige Tupel eindeutig und invariant b^ghchTraisktion^ und 
Rotatfonen 290 der molekularen Struktur (200, 250) und jeglichen Rotattonen 215a von jeder molekularen 

Substruktur(210,220)umrrgendeinedrebhare Bindung 218a herum ist . 

AuBerdem wird fur jedes gebiMete Tupel (335, 345, 355) in der oben beschnebenen Weise em nut dm Tupel ss 
verknupftes schiefwinkliges lokales Koordinatensystem 245 abgeleitet Mit den magjamo, Vektoren238 &248 
ist Velrtorinformation verknupft and ist in jedem der sdiiefwinkugen iokalen I^rdinatensysteme 245 darge- 
steUt Daher smd die Velaoriitfonnadon, die Identimt der n^^^ 

laren Substrukturen (210, 220, 2301 die Identhiten der drehbaren Bmdungen 218a und 218b, der Index 41* das 
Tuoel335 und das schiefwinklige lokale KDordinatetisystetn245ane miteinander verknOpft ^ _ 60 

Vektorinformation ist Information fiber gegebene magiscbe Vdctoren 238 & 248 und beinhaltet die Darstel- 
lunsen der magischeD Vektoren in dem schiefwinkDgen Iokalen Koordinatensystein 245. 

Bei einer bevorzugten Ausfuhrungsfonn ist diese Vektorinformation die expuzrte und/oder unpuzite Darstel- 
lung der magbchen Vektoren, wie oben beschrieben (Fig. 2A). . 

Bs ist zu erwahnen, daB ein ausgewahltes Tupel 335 und das zugebdnge gebildete Dreieck 336 auch m emer es 
anderen molekularen Struktur als 200 auftaucfaen kann. Dies erfotdert die Vertesserung der Ve^r^rmaBon 
mh der Berficksichtigung der oben beschnebenen Idenutat der molekularen Struktur; diese BerOctechtigung 
erlaubt die Identifizienmg der einzelnen molekularen Struktur 200, der die Vektorinformation entspncht 



15 



DE 196 42 651 Al 

Fte. 4 ist ein Btockdiagramm einer Datenstruktur 400, die einen Index 414, der zu einem Tupel (rypischerweise 
335, 345, 355) gehSrt, mit Information fiber die Identitaten der Atoroplatze, die an dem Tupel teilhaben, und 
Information verknQpft, die zu den Darstellungen 238A und 248A von magischen Vektoren 238 und 24* in dem 
schiefwinkligen lokalen Koordinatensystera 245 des das Tupel erzeugenden, Index 414 gendrt Man beachte, daB 
das Tupel, das mit dem Index 414 verknupft 1st, mehr als eromal in eraer raoleknlaren Stmktur (200, 250) oder in 
mehr als einer molekularen Struktur (200, 250) in einer Datenbank D anftauchen kann, die eine Mehrzahl von 
molekularen Strukturen (200; 250) enthalt Als eine Folge davon gibt es im allgememen mehr als einen Hntrag 
412 von Vektorinformation in einen Datensatz 425 der Datenstruktur 400. Demzufolge beinhaftet jeder derarti- 
ge Eintrag, rypischerweise 412, von Vektorinformation Identifikationsinformationcn fur jede der molekularen 
Strukturen 421 A bis 421N, in denen der das Tupel erzeugende Index 414 auftaucht Ein Datensatz 425 enthalt 
auBerdem das KoordinatensystemtupelfelcL das alle die Informadonen beinhaltet, die zu dem Index 410 gehoren. 
das Kaordmatensystemtupel, das es erzeugtc und potcntfell weitere Informanonen. 

Wie oben beschrieben, wird der emdeutige Index 414 erzeugt, der das Tupel 335 darstellt Dieser Index 414 
kann unter Verwendung eiuer beliebfeen Anzahl geometrischer Merkmale, Egenschaften der Ptatze des Topels, 
chenrischer und/oder physikalischer Informadonen Ober das Tupel oder die Atomplatze des Tupels eta erzeugt 
werden. AuBerdem kann dieser Index einem Offset in einem eindimensionalen finearen Datenfeld wie 400 
zugeordnet werden, indem abliche Offset-Berechungsverfahren (z. B. *Schritf -Berechnnng) verwendet werden. 
Zura Beispiel wird unter Verwendung von 11, 12, 82 und dem SYBYL-Atomtyp des zweiten Atomplatzes in der 
(normierten) Reihenfolge zur Erzeugung ernes Index der berechnete Offset <<L h. die Stefle in der Datenstruktur 
20 400) wie folgt bestnnmt: 

LMan quantisiert den Wert V* jeder Eigenschaft At fi- 1, 2, 3, 4, . . .)> indem man den ganzzahligen Wert des 

Ausdrucks: 

m ai i x (STEPS [AJ - i) 
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max (A.) - miiiCAp 

niramt, wobei min(Aj) der minimale Wert ist, der fiir die Eigenschaft Ai erlaubt ist, max(Ai) der maximale Wert ist, 
der fOr die Eigenschaft A s erlaubt ist, STEPS(Ai) die von den Daten abhangige Anzahl von Quanusierungsscnnt- 
ten ist, in die das Interval! [min(AiX max(A;)] unterteflt ist (cfiese Anzahl von Schrhten wird vor dem Anwenden 
des Verfahrens festgelegt und fixicrt), und i den Satz von Eigenschaf ten durchlftuft, die zur Erzeugung des Index 
414 verwendet werden. Beispiel: Weim die Langeneigenschaft 11 den Wert 1,3 Angstrom besitzt und unter der 
Annahme, daB der Bereich mdg&her Werte, der sich von 0,9 Angstrdm bis 4,5 Angstram erstreckt, in 64 
Quantisierungsschritte unterteflt wurdejst der abgeleitete quandsierte Wert fur II: 



40 



1,3 ~ 0.9 
4,5 - 0,9 



x (64 - 1) 



= 6. 
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In einer ahnlichen Weise wird der quantiaerte Wert jeder Eigenschaft Ai bestiramt Es ist zu eiwahnec,daB fOr 
Egenschaften Ai, die foharent Werte aus einem endlichen Satz von ganzen Zahlen annehmen konnen (z. B. <fie 41 
SYBYL-Atomarten), die Variable STEPS(A|) auf die KardinaKtat dieses Satzes von ganzen Zahlen reduziert 
werden kann. . tn , . # „ _ 

2. Man nimmt die quantisierten Werte Ai und rechnet unter Verwendung ernes 'Schntf -Berechnungsverfan- 
rens den Offset in die lineare Anordnung 400 hinein. In dies em speziellen Beispiel Hegen die folgenden Entspre- 
chungen vor: Ai 11, A 2 ~ 1£ A3 ~ A* SYBYL-Atomart Die Berechnnng des Offsets ergibt: 

A 1 • [STEPSIAJ • STEPS^) • STEPSiAJ) 
+ {STEPS[A 3 ) • STEPS (A,)) 
+ A^ • STEPS iA 4 ) 
+ A J 



ss offset = 



Die Struktur 400 wird durch Prozesse 500 und 600 verwendet. wie unten beschrieben. Die Er6rtenmg nahm 
bislang implizit an, daB (0 jede molekulare starre Substruktur (210, 220, 230) wenigstens zwei an diese angebun- 
dene oYehbare Bindungen 218a und 218b besitzt; (u) jede molekulare starre Substruktur(210, 220,230) emimtihr 
verknupftes magisches Vektorpaar aufweist; und frii) daB die Sememe des magischen Vektorpaars manebmal 
mit Hflfe von drehbaren Bindungen definiert sindL . m m . 

Sowett es die Annahme Q betrifft, kann dies klarerweise nicht immer der Fall sew, Tatsachlich sind me 

fob 
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(a) starre Substrukturen ohne drehbare Bindungen; mit anderen Wbrten, einige molekulare Strukturen in 
der Dateobaak D konnen stair sein und keine drehbaren Bindungen enthalten; 

(b) starre Substrukturen mit einer drehbaren Bindungen, die von der Substruktur ausgeht; dies ist zum 
Beispiel der Fall der starren Substrukturen 210 und 230 in Fig. 2; und 

(c) starre Substrukturen mit mehr als zwei drehbaren Bindungen, die von der Substruktur ausgehen. s 

Die Tatsache, daB molekulare Strukturen mit einer oder mehr der obigen drei Charakteristika ebenfalls in der 
Datenbank D vorbanden and, erfordert eine leichte Modifikation der oben beschriebenen Prozedur zur Index- 

"fc^ffinblick auf die Annahme (ii) wird als nachstes erlautert, wie das magische Vektorpaar bestimmt wird In to 
dem Fall von starren molekularen Strukturen, die keine drehbaren Bindungen enthalten (Fall (a) oben), kann das 
magische Vektorpaar nicht mit Hflfe der drehbaren Bindungen erzeugt werden. Statt dessen kann das magische 
Vektorpaar in einer bevorzugten AusfQhrungsfonn leicht durch Identffizieren von zwei Paaren von Atomplat- 
zen definiert werden: ein derartiges Paar von Platzen kann zum Beispiel durch I) das Paar von Atomplatzen, die 
in der betrachteten molekularen Struktur am weitesten voneinander entfernt sind, und 2) das Paar von Atom- is 
platzen gebildet werden, die so weit wie mdglieh voneinander entfernt liegen und eine Rfchtung festlegen, die so 
orthogonal wie rodgiich zu der durch das erate Paar deftnierten Richtung ist AuBerdem and Modifikabonen 
dieser Prozedur mSglieh; Das Hauptziel hier 1st die Erzeugung eines nicht entarteten magischen BCoordinatensy- 
stems. Die Lmie, welche die zwei P&tze des ersten Paares verbindet, entspricht der Achse des Vektors 23& Dies 
kann als Equivalent zum VorEegen einer 'fiktiven drehbaren' Bindung 218a angesehen werden, wekhe die starre 20 
Substruktur 210 mit sich selbst verbmdet Die Richtung des Vektors 238 kann jedoch nicht linger durch 
Verwenden der Bezeichmmgen der fraglicben starren Substrukturen bestimmt werden: eine bevorzugte Aus- 
fQhrungsfonn fQhrt eine Modification ein, gem*B der die Richtung von 238 durch Verwenden der Aimhl der 
Atomplatze bestimmt wird, welche die (fiktive drehbare) Bindung verbmdet: Es wird angenommen, daB die 
Konventfon fur die Richtung kocsistent fur afle der einen oder mehr analysierten molekularen Strukturen 200 2s 
vom Atomplatz mit der kleineren (grdBeren) Zahl zu dem Atomplatz mit der groBeren (kleineren) Zahl verlauft 
In einer ahnlichen Weisc entspricht <fie linie, welche die zwei Platze des zwehen Paares verbmdet, der Achse des 
Vektors 248; die Richtung von 248 wird durch die gidche {Convention bestimmt, die zur Besommung der 
Richtung des Vektors 238 verwendetwurde. 

Analog kann in dem Fall von starren molekularen -Substrukturen mit einer drehbaren Bindung, die von der 30 
Substruktur ausgeht {Fall (b) oben), einer der magischen Vektoren mh Hflfe der vorhandenen drehbaren 
Bindung definiert werden, wihrend der zweite magische Vektor die Erzeugung einer Tiktiven drehbaren' 
Bindung, wie oben erliuiert, erfordert In einer bevorzugten Ausffihrungsform kann dies leteht durch Wentifizie- 
ren eines Paars von Atomplatzen in der betrachteten starren molekularen Substruktur erreicht werden, mit der 
offensichdichen Etosdffatucung, daB das durch das magische Vektorpaar erzeugte inagische Koordmatensystem 3s 
nicht entartet ist Die Richtung der (fiktiven drehbaren) Bindung und somit des zwehen magischen Vektors wird, 
wie beretts oben erlautert, durch Konvention bestimmt In einer alternativen Amfuhrungsform kSnnen beide 
magische Vektoren in Form von fiktiven drehbaren Bindungen definiert werden. ^ 

\ m fall von starren molekularen Substrukturen mit mehr als zwei drehbaren Bindungen, die von der Substruk- 
tur ausgehen (Fall (c) oben), gibt es eine Wahl dahmgehend, wie das magische Kcordmatensystem (Equivalent: 40 
das magische Vektorpaar) definiert wird. Zum Beispiel konnen zwei der drehbaren Bindungen bei der Definition 
des magischen Vektorpaares verwendet werden; klarerweise genfigt jedes beliebige Paar drehbarer Bindungen, 
das zu einem nicht entarteten magischen Koordinatensystem fQhrt Altemativ kann ein magischer Vektor mit 
Hilfe einer der drehbaren Bindungen definiert werden, wahrend der zweite rait Hflfe einer 'fiktiven drehbaren' 
Bindung definiert werden kamu Oder es konnen beide magischen Vektoren in Form von 'fiktiven drehbaren' 45 
Bindungen definiert werden. . . 

Hin und wieder und fur jene starren Substrukturen 220, die mehr als zwei drehbare Bindungen aufweisen, die 
von der Substruktur ausgehen, kann es wtmschenswert sein, eine gewisse Redundanz einzufQhren und mehr als 
zwei rah der starren Substruktur 220 zu verknfipfende, magische Vektoren zu definieren; das magische Koordi- 
natensystem kann dann in Form von beliebigen zwei nicht koflinearen Vektoren aus dem Satz magischer 50 
Vektoren definiert werden. In besthnmten Attsfuhrungsformen konnen die implmten oder expliziten Darstellun- 
gen all dieser magischen Vektoren in einen Eintrag 41 2 der Datenstruktur 400 auf genommen werden. 

Was die Annahme (in) betrifft, ist es aus der Analyse der vorherigen paar Abstoe Jdar, wie die Verwendung 
der drehbaren Bindungen bei der Definition magischer Vektoren ausgedehnt werden kann. Von einem berech- 
nnngsmifligen Standpunkt aus erleichtert die Definition eines magischen Vektors mit Hilfe einer drehbaren 55 
Bindung des weiteren die Erhartung konsistenter Ergebnisse wahrend der Stufe des Vergleichens, wobei 
Konformarionen in Obereinstimmung mit so vielen erzeugten Antworten (d h. hypothetische Plazienmgen fur 
die jeweilige starre Substruktur) wie mdglieh bestimmt werden (fur eine ErlSuterung stehe unten). Gefcgcntfich 
kann es wunschenswert sein, einen Eintrag 412 der Datenstruktur 400 urn die Darstellung von einer oder 
mehreren der drehbaren Bindungen, die von einer starren Substruktur ausgehen, in einem sehiefwinkbgen go 
lokalen Koordinatensystem zusatzlich 2U der Darstellung der magischen Vektoren zu vergroBem; mit anderen 
Worten enthilt ein Eratrag der Datenstruktur 400 die Darstellung in einem schiefwinkHgen lokalen Koordina- 
tensystem von zwei oder mehr Vektoren, die Starr an die starre Substruktur angebunden sind, zu der das 
schiefwinklige lokale Koordinatensystem gezeichnet ist Siehe aucfa die Beschreibung der Verwendung der 
Abstimmtabelle unten. 65 

Als SchluBfolgerung ist zu erwShnen, daB es, wenn fiktxve magische Vektoren erzeugt werden, Situationen 
geben kann, in denen es notwendig ist, Symmetrien zu brechen. Zum Beispiel: molekulare Strukturen, die zwei 
Paare von Atomplatzen enthalten, deren Paarelemente sich in gieichem Abstand voneinander befindea Urn 
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diesen Problempunkt zu Iosen, kann eine Ausfuhrungsform zura Beispicl das Paar, das den Atomplatz mit der 
niedrigstea Nummer enthilt, b ehalten und den anderen ausscheiden. 

Mit den beschriebenen ModSfikationen kana nun jedc molckularc starre Substruktur 210, 220, 230 einer 
molekularea Struktur200, 250 mit einem Paar magischer Vektoren 238 und 248 verknOpft werdea, die wie Qblich 
in jedera scrriefwinkligen lokalen Koordinatensystem 245 ausgedruekt werden konnen, die aus dem Referenztu- 
pel-Auswahlsatz erzeugt werden kdnnen 

Der ProzeB 500 analysiert einen Satz aus einer oder mehreren molekularen Strukturen (200, 250) in einer 
Datenbank D, die eine Mehrzahl von molekularen Strukturen (200, 250) enthah. indem fur eine Mehrzahl von 
Iodizes 414 keme oder mehr molekulare Strukturen (200, 250) und/oder Substrukturen {210, 220, 230) bestimrnt 
werden, die Tupel enthahen, die bezugikh der Eigenscbaften A| ahnfich sind, die dazu verwendet werden, den 
Index 414 zu besthnmen, fur den jede dieser molekularen Strukturen (200, 250) und/oder Substrukturen (210,220, 
230) einen Eintrag 412 erzeugt; 

(a) Identifizieren (421 A bis 421N) einer der molekularen Strukturen (200, 250} die rait einem gegebene-n 
magischen Vektorpaar 238 und 248 verknOpft 1st; 

(b) Identifizieren des Koordmatensysterntupels, das den Index 414 erzeugte; 

(c) Identifzieren (422A bis 422N) der starren molekularen Substruktur (210, 220, 230), aus der das Tupel an 
der Datenfeldstelle der Struktur 400 entnommen wurde, die zu dem Index 414 gehSrt 

Aufierdem vennebrt der ProzeB 500 diese Eintrage 412 urn Vektorinformadonen 238A Qberjeden der zwei 
oder mehr magischen Vektoren in jedera der schierwinkGgen lokalen Koordiiratensysteme 245, die durch jeden 
der Indtzes 414 in der gesamten Datenbank D von molekularen Strukturen dargestellt sind In diesen EintrSgen 
412 kann auch zusatzliche Information enthalten sein. 

Sobald der ProzeB 500 die Datens truktur 400 bevolkert hat, enthah die Datenstruktur 400 alle Strukturen (200, 
250) und/oder Substrukturen (210, 220, 230) in der gesamten Datenbank D, die gemaB den Tupdeigenschaften 
klassifraert sind, die zur Bestimmung des Index 414 verwendet werden, zusammen mit invarianter Information 
uber die magischen Vektoren 238 und 248 (diese kdnnen realen oder fiktiven Bmdungen entsprechen), die in 
jenen Strukturen (200, 250) vorhanden sind, und mdgUcherweise weheren InformationeiL 

Fig. 5 Est ein FuiBdiagramm, das die Schritte des Bev6lkerns der Datenstruktur von Fig. 4 zeigt, damit diese 
struktureile Infonnatbnen and andere Informationen uber ein oder mehrere Refer enzmolekule enthah. Dieser 
ProzeB wird ReferenzspeicherprozeS 500 genannt Der ProzeB 500 verknupft einen Index 414, der zu einem 
Tupel (rypischerweise 335, 345, 355) gehort, mit Vektorinformation 420, die den Darstellungen 238A f Or jeden 
der zwei oder mehr magischen Vektoren, die mit einer starren Substruktur verknOpft sind, in dem schiefwink- 
ligen lokalen Koordinatensystem 245 des Tupels entspricht, das den Index 414 fur jedes Molekul in der Daten- 
bank D aus einer Mehrzahl bekannter Molekule erzeugt 

Der ProzeB 500 beginnt mit der Auswahl 505 ernes Molekuls mh einer Identifikation aus der Datenbank D aus 
bekannten Molekfilen. Diese Identification kann eine beiiebtge bekannte Weise des Bezeichnens eines MoIekQls 
sein, wie oben beschrieb en, z, B.ein Schema zur Numerierung der Molekule. 

Schritt 510 bestimrnt die Anzahl von starren Substrukturen (210, 220, 230) in dem ausgewahlten Molekul 505 
und die Anzahl drehbarer Bindungen, die von jeder Substruktur ausgehen. 

Dann wird eine starre Substruktur aus dem Satz der starren Substrukturen (210, 220, 230) des ausgewahlten 
Molekuls 505 ausgewahlt 515; nachfolgend wird ein Satz von zwei oder mehr magischen Vektoren 238, 248 fur 
die ausgewahlte Substruktur bestimrnt 520; die Bestimmung der magischen Vektoren und von deren Position 
und Orientierung in dem gbbalen Koordinatensystem 235 wird in der fruhcr beschriebenen Weise erreichtWie 
bereits angegeben, kann ein magischer Vektor in Form einer drehbaren Bindung defmiert werden, die von der 
betrachteten Substruktur ausgeht, es ist jedoch nicht notwendig* Es- wird ein Ref erenztup el-Auswahkatz fur die 
ausgewahlte 515 starre Substruktur erzeugt 525. 

In Schritten 530, 535, 540, 545, 550 und 555 werden ein Tupel, das zugehdrige schiefwmklige lokale Koordina- 
tensystem 245 und ein Index (« Ref^nzkoordmateiisystemtupeHridex) in der Datenstruktur 400 — wobei der 
Index eindeutig fur das Tupel ist - fur jedes Tupel erzeugt, das aus dem Refwenztupel-Auswahlsatz gebildet 
werden kana Bei einer bevorzugten Ausfuhrungsform werden ledigttch normierte Tupel verwendet (siehe 
oben). 

In Schritt 530 wird ein Tupel durch Auswahleu unter den Elementen des Refcrenztupel-Auswahlsatzes 
erzeugt In Schritt 535 wird ein scluefwmkliges lokales Koordinatensystem 245 von dem in 530 erzeugten Tupel 
erzeugt, wie in den Fig. 2 und 3 oben beschrieben; jeder der zwei oder mehr magischen Vektoren 2381 24* der 
mit der ausgewahlten 515 Substruktur 210, 220, 230 verknOpft ist, wird in dem schiefwinkligen lokalen Koordina- 
tensystem 245, das durch das Tupel defmiert ist, dargestellt 54a Oben sind verschiedene Weisen der DarsteDung 
540 der magischen Vektoren beschrieben, 

In Schritt 545 wird der mit dem erzeugten Tupel 530 verknflpfte Index 414 erzeugt (siehe oben hinsichtficb 
bevorzugter Ausfuhrungsform en zur Erzeugung von Indizes). In Schritt 550 wird die Darstellung 540 jeder der 
zwei oder mehr magischen Vektoren 238, 248 in dem Datenfeld/der Datenstruktur 400 als ein Eintrag 412 
gespeichert Man beachte, dafl der Eintrag 412 mit dem Index 414 verknupft ist, der dem ansgewahlten/erzeug- 
ten Tupel 530 entspricht In Schritt 555 bestimrnt der ProzeB 500, ob mehr Tupel von den Elementen des 
Referenztupel-Auswahlsatzes 525 zu erzeugen rind 53a Wenn mehr Tupel zu erzeugen sind, werden die Schritte 
530, 555, 540, 545, 550 und 555 wi ederhoh. Wenn keme Tup e i mehr zu erzeugen sind 555, wird das kientinzierte 
Molekul 505 uberpruft 560, um zu bestimraen, ob alle seiner starren Substrukturen bearbeitet wurden — mit 
'Bearbertung' ist filer gemeint, daB em Entrag 412 in die Datenstruktur 400 gemacht wird. Wenn eine der 
Substrukturen des identifizierten Molekfils 503 weiterhm unbearbeitet bleibt 500, wird die unbearbeitete Sub* 
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struktur ausgewahlt 515, und die Schritte 520, 525,530 > S35,540,545,550mid555werdenwiederfaoU. 

Wenn aile starren Substrukturen in dem ausgewahiten Molekul 505 bearbehet wurden, bestimmt 570 der 
ProzeB 500, ob es irgendwelche unbearbeiteten Molekule in der Datenbank D gtbt Wenn es welche gibt beginnt 
der ProzeB 500 von neuem rait Schritt 505 mit einem neu ausgewahiten Molekul Wenn es keine gibt, endet 575 
der ProzeB 500, wobei er die Datenstruktur 400 mit alien mfiglichen DarsteIIungcn412 von jedem der zwei oder 
raebr magischen Vektoren 238, 248 in alien sdaierwinkfigen lokalen Koordinatensystemen 245 von alien starren 
Substrukturen 210, 220,230 jedes Moiekuls 505 in der Datenbank D bevoBcert hat Es ist zu erwahnen, daB mehr 
als eine DarsteDung von magischen Vektoren (z. B. 412A bis 412N) in der Datenstruktur 400 angeordnet werden 
kann, wie sie mit einem gegebenen Index 414 verknQpft ist der einen Datensatz 425 der Datenstruktur 400 

iden^ert ^ FIuBdiagramm, das die Schritte des Vergleichsprozesses 600 zeigt Der VergleichsprozeB verwen- 
det tfeDatenstniktur 400, oledu^ . tl . 

Der ProzeB 600 bildet Tupel aus dem Vergleichstupel-Auswahlsatz ernes beliebigen gegebenen TestmotekQls 
und einen Satz von Indizes 414, die tfesenTupeln in der oben beschriebenen Weise entsprechen. Dieser Satz von 
Indizes ist der Testindex'-Satz. Bei gegebener Information in der Datenstruktur 400 und gegebenem Testindex- 
Satz kann der ProzeB 600 jene Strukturen (200, 250) und/oder Substrukturen (210, 220, 230) aller der Molekule in 
der Datenbank bestimmen, die Tupel enthalten, welche identische Eigenschaften A* mit den Tupeln des Testmo- 
lekuls teilen, die zur Erzeugung des Testmdex-Satzes verwendet wurden. Des weiteren kann der ProzeB 600 
unter Verwendung einer markierenden Datenstruktur 700 und der Information (410, 420) bestimraen, ob das 
ganze oder em Teil des Testmolekuls identisch mh einer oder mem- Strukturen (200, 250) und/oder Substruktu- 
ren (21ft 220, 230) in der Datenbank ist , 

Der ProzeB 600 beginnt mh der Auswahl 605 eines Testmolekuls von einer Sammlung aus einem Oder 
mchreren Testmolekfilen. Dieses TestmolekOl wird gegenuber der Datenbank D geprQft, urn jene Molekule von 
D, die molekulare Substrukturen (210,220) enthalten, die mit dem Testmolekul zusammenpassen, ziisammen nut 
dem Satz starrer Transformationen (d. h. starrer Rotanonen und Translationen) zu identffizieren, die bewirfcen, 
daB jedes dieser Molekule am besten mit dem ausgewahiten 605 Testmolekul uberlappt fbeste ^eremstim- 
mwg\ Mit 'Zusammenpassen' ist hier gemeint daB: (a) das identifizierte Molekul (oder die identiftderten 
MolekOle) in D identisch mit dem Testmolekul ist (sindft oder (b) das identifizierte Molekul (oder die identmzier- 
ten Molekule) in D Substrukturen (210i 220, 230) enthalt (enthalten), deren Telle mit dem Testmolekul in semer 
Gesamtheit zusammenpassen; oder (c) das Testmolekul einen Teil enthalt, der mit dem identifizierten Molekul 
(oder den identifizierten Molekulen) in D in seiner Gesamtheit zusammenpaBt; oder (o^ das Testmotekffl einen 
Teil enthalt, der mit Teilen von einer oder mehreren starren Substrukturen m dem identmzierten Molekul (oder 
den Mentifizierten Molekulen) von D zusammenpaBt Man beachte, daB das Testmolekul und das identifizierte 
Molekul (oder die identifizierten Molekule) von D nicht in der gfeichen Konformation vortiegen mussen. Der 
ProzeB 600 bcstimmt im wesentUchen, ob das Testmolekul mit einem oder mehrereo Molekulen m D fur erne 
gegebene Konformation der leizteren zusammenpaBt Der ProzeB 600 bestimmt auBerdem die erforderfichen 
starren Transformationen, die das (die) idenuTizierte(n) Molekule) in die Konformation bringen, cfae am besten 
mit dem Testmolekul fibereinstimmt Fur ein verwandtes System und Verfahren, das ledfglich die Identitat ernes 
(von) Moiekuls (Molekulen) in D, jedoch nicht die starren Transformationen bestimmt (Henotwendig stod, urn es 
(sie) in beste Oberanstimmung mit dem ausgewahiten 605 Testmolekul zu bringen, nehme man bitte Bezug auf 
die US-Patentanmeldung, eingereicht am 22. Dczcmber 1995, mh dem Utel 'System and Method for Conforma- 
tionally Flexible Molecular Identification', von L Rigoutsos und A. Califano, die am glefchen Tag wie diese 
Anmeldun g eingereicht wurde und die in ihrer Gesamtheit hierin auf genommen wird. 

In dem optionalen Schritt 610 bestimmt der ProzeB 600 unter Verwendung irgendemer der ubbchen Vorge- 
hensweteen, ob eine oder mehrere drehbare Bindungen in dem Testmolekul vortiegen. Indem dies durchgefimrt 
wird, werden aile starren Substrukturen (210, 220,230) in dem Testmolekul identifiziert 

Wenn lediglich eine starre Substruktur vorhanden ist wird jene starre Substruktur ausgewahh 62a Wenn es 
mehr als eine Substruktur gibt wird eine Substruktur ausgewahh 620, die vorher nkht ausgewahlt wurde. Es 
wird ein Vergleichstupel- Auswahlsatz fQr die ausgewShlte Substruktur des Testmolekuls 605 erzeugt 625. 

In Schritten 630, 635, 645 werden ein Tupel, das zugehSrige schiefwinkKge bkale Koordinatensystem 215 und 
ein Index (- Testkoordinateiisystemrapelmdex), der fur das Tupel eindeutig ist fur jedes Tupel erzeugt das yon 
dem Ver^erchstupel-Auswahlsatz gebildet werden kann. Bei einer bevorzugten AusfOhrungsform werden ledig- 
lich normierte Tupel verwendet (siehe oben). _ 

In Schritt 630 wird ein Tupel durch Auswahl unter den Elementen des Vergleichstupel-Au5wanlsatzes ausge- 
wahlt In Schritt 635 wird ein scniefwinkiiges lokales Koordmatensystem 245 von dem in 630 erzeugten Tupel 
erzeugt wie in den Fig. 2 und 3 oben beschrieben. In Schritt 645 wird der Testkoordinatensystemtupelmdex 6451, 
der mit dem erzeugten Tupel 630 verknOpft ist erzeugt (siehe oben hinsrchtKch bevorzugter Ausfuhnmgsformen 
zur Erzeugung von Indizes). . , . , 

Man beachte, daB die Schritte 610, 615, 620, 625, 630, 635 und 645 fur das Testmolekul in oner tdentischen 
Weise durchgefimrt werden wie die jeweuigen Schritte 510,515,520, 525,530,535 tmd 545 fur aile Referenzmo- 
lekQle in der Datenbank D durch den ProzeB 500 durchgefuhrt werden. Daher ist der Testkoorc^ensystemtu- 
pellndex 645ifQrdas zugehorige Tupel eindeutig und invariant unter Translation 295 und Bottttonen 290 der 
molekularen Struktur (200, 250) und jeglicher Rotationen 215 einer beliebigen Substruktur (210, 220, 230) urn 
drehbare Bindungen 218a, 218b herum, die in dem ausgewahiten Molekul 605 vorhanden sind 

In Schritt 650 gewinnt der ProzeB 600 Darstellungen und andere Infbrmationen aus der Datenstruktur Idem 
Datenfdd) 400 unter Verwendung des Testkoc^dmatensystemtimelinder- In dem Fall, in dem das i TestrnolekOl 
identisch fra alien Gesichtspunkten, die durch den gebildeten Index abgedeckt sind: z, B. physikahsche, cheim- 
sche, geometrische etc) mit einem oder mehreren der MolekOle in der Datenbank D ist gibt es wemgstens emen 
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Eintrae 412 von Vektorinformation 420 in dem Datensatz 425, auf den durch jedcn erzeugten Testkoordmaten- 
svstemmpelinde* 645i zugegriffen wird, in der Datenstruktur 400, der die gleiche Vektonnformation aufweist. 
die iedeu von zwei oder mehr magischen Vektoren in demTestmolekfil beschreibt Der Testlawrdinatensystem- 
tupelindex 645i greift auf den Datensatz 425 zu, da der Testkoorciinatensystemtupelmdex 645. Kfontisch nut dem 
Refcrenzkoordinatensystemnipeltadex 414 ist, da sie beide von den gleichen molekularen Simstruktoen (210, 
220,230) unterVerwendungder gleichen Sdiritt^^^ 
625! 630, 635, 545) erzeugt wurden. 

Es ist jedoch zu erwahnen, daB es weitere Molekule (oder starre Substrukturen und/oder Tefle von starren 
Substrukturen) in der Datenbank D geben kann, die Tup el enthalten, die Refereiizkooj^naten^mtupelmi. 
zes 414 erzeugen, welche die gleichen wie die Twtkoordmatensvstemtupebndtzes 645i smd Dies ist so. da die 
entsprechenden Tupel identisch in bezug auf die gewahlten Eigenschaften Ai sind, aus denen »wobJ der 
Refereozkoordinatensvstemtupelindex 414 als auch der TestkoordmtensystemtupeUndex 645i bestcfat Zum 
Beispiel erzeugt in dem Fall, in dem die Eigenschaften geometrisch 01/12/92, we oben) und vomAtcmweutes 
Plates (Atomtyp, wie oben) sind, das Tupel A-B-E in Kg. 2A den glefchen Index, ungeachtet des_ teteacUiJ» 
chenriscnen Typs der, Atome B und E, solange die Werte der Eigenschaften, die den Index bilden. rfentisch 
bleiben. Daher wist die Struktur 400 Informationen auf, die beta Identifizieren yon emem oder mehr Moleku- 
Ian (ebenso wie der notwendigen starren Transformationen) von der Datenbank D, die nut emem gegebenen 
Testaiolekfil zusammenpassen (siehe oben hmsichufch einer Definition von ^usanunenpassenO | d^Bestim- 
men der Haufigkeit des Auftretens impliziter oder expliziter Information nOtzhch sind, die durch die Vektonn- 
formation 420 in einer oder mehr der Eintrage 412A bis 412N gegeben ist, wie unten ^schrKben. 

Nach der Gewinnung der Vektormf ormation far die drehbaren Bindungen In Schntt 650 wird die Vektonn- 
formation 420 fur jeden Eintrag 412A bis 412N des Datensatzes425, auf den durch den Testkrordmatensystem- 
tupelindex 645i zugegriffen wh-d, dazu verwendet, die Position und Orfennernng m dem glob^ K^r^a^ 
system 235 von jedem der zwei oder mehr magischen Vektoren zu gewmnemdie in jedem Emtrag412A bis 412N 
uTSem Datensatz 425 enthalten sind. Diese gewonnenen F5De der magachen Vektoren Mnnenm dieser 
Erorterung anch alsTestvektoren bezeichnet werden. Die Gewinnung wird ^ h / k ^,^ 
von jedem der zwei oder mehr magischen Vektoren, die in den Entragen 412A bis 412N enthalten mid, und 
ubUche Vektoranalyseverfahren erreicht; furjeden Eintrag in jedem Datensatz mrt einem Referenzkooidmaten- 
systemtupelmdex, der mit demTestkrordinatensystemtupefindex zusammenpaBt, erzeugen wir emen Absttmm- 
datensatzm einer Abstimmdatenstruktur 655, wobei der Absthnmdatensatz Amrdniingsinformationen m dem 
gtobaleo Koordinatensystem 235 ffir jeden der magischen Vektoren enthalt, deren Oaj-stellungen trv denEin^ 
aen 412A bis 412N enthalten and. Bei aiternativen bevorzugten Ausfuhrungsfonnen koonen die moieKUiare 
Idendtat421Abfe42lNimd/oderSiibstru^ 

nen Anordnungsinformation verwendet werden, wenn die Abstimmtabeue bevolkert wird. 

In Schritt 660 wird jeder der in Schritt 650 erzeugten Abstimmdatensatze in die Abstimmtabeue emgegeben 
(siehe 700 unten). Klarerweise erzeugt Schritt 650 viele identische Abstimmdatensatze, 
welche die gleiche Anordnungsinformation, molekmare Mentifatsinformation und SubstrukturTdentitatanfor- 
mation enthalten. Dies ist das Ergebnis von mehr als einem KoordinatensystemtupeL die erne hestimmte 
Anordnung in dem globalen Koordinatensystem 235 ffir eine gegebenc starre Substruktur ernes Molekffls 
JSSDaV Ausmafi an Zusammenpassen zwischen einem Tea eines TestmotekOls und ^m oder mehr 
Teilen von einer oder mehr Substrukturen von einem oder mehr Molekfilen m der DatenbankD steht mdiretoer 
Beziehung zu der MuMplizitat derartiger identischer Abstimmdatensatze oderaqinvalent zu der Haufigkeit des 
Auftretens jedes der unterschiedliclen Abstimmdatensatze m der^tirmntabeBe 700-_ 

Sobald die Abstimmdatensatze, die outer Verwendung der Punkte in den Emtragen. 412A bis 412N der 
Vektorinf ormation 420 ffir den Datensatz 425, auf den zugegriffen wurde, erzeugt wurden. m die Al>sUnmitabeue 
emgegeben sind, bestimmt 665 dann der ProzeS 600.ob mehr Tupel von den Elementen des. ^^Pfl-^ 
wahisatzes 625 zu erzeugen sind 630. Wenn mehr Tupel zu erzeugen smd 665. werden dieScfantte 630,635,645, 
650 und 655 wiederholt Wenn keine Tupel mehr zu erzeugen sind 665, wird das TestmolekOl 605 gepruft 670, urn 
zu bestimmen, ob alle Substrukturen (210,220, 230) bearbeitet wurden. 

Wem es nam mehr unbearbeitete Substrukturen gibt, wird eine derartige Substruktur ausgewahh 620, und 

Rg. 7 gezeigt ist, durch Abstimmdatensatze 725 bevolkert, die durchdie Sotrage der Datenstruktur 400 erzeugt 

"T^er Datensatz 725 der Abstimmtabelle besitzt eine Adresse 710 und enthilt die Information fiber die 
RrferenzmolekuOdentitat, die Information fiber die Identitat der starren Referenzkoordmatensystemsubstruk- 
tur und Anordnunganformationen ffir jeden der zwei oder mehr magischen Vektoren, deren Darstellangen m 
Emtragen 412A bis412N des Datensatzes 425 enthahen sind, auf den durch den Testkoordinateiisystemtupe&> 

de 5efemef Srzu?S Ausfuhruogsform werden die Molekfilidentitat 736 und/oder die Identitat 738 der 
starren Substruktur 210 dazn verwendet, urn die Adresse 710 jedes Afatirnmdatensatzes 725 zu berectaea Die 
Adresse 710 wird durch das oben beschriebene 'Schritf-B^echnungsveriahren bestimmt Bei emer altonaUven 
bevorzugten Aiafuhrongsfonn konnen die Anordnungsmformauonen far jeden der zwei oder mehr raaglscben 
Vektoren, deren DameUungen in den Emtragen 412A bis 412N des Datensatzes 425 enthalten smd, dazn 
verwendet werden, die Adresse 710 des Datensatzes 725 abzuleiten. , ._ 

l^raebxzuHg. 6 zurfickkehrend, wird die bevdlkerte Abstmrnitabefle 700 dazu verwendet, urn zu besttm- 
m3) die Identitat von einem oder mehr Molekfilen in der Datenbank D.fu) die ^^^^"J^^ 
starren Substnikturen in jedem Molekul und (ui) die Position und Onenoenmg der nut jeder starren Substruktur 
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W r^,inften maaschen Vektoren, so daB (a) eine starre Substruktur in jedem toartigen Molekfil der beste 
SSftSSmSS ""it einer Substruktur in dem Testmotekul ^ und(b) wcnn cme derartige 
&ibstruktur in dem giobaten Koordinatensystem 235 angeordnet ist, so daB db Poaton und Onenuerarg 
dSgehdriwnmagischen Vektoren mitdenjenigen zusammenpaBt.die inCm) bestmnnt wurdcajedcsidentifi- 

dlr Datenbank D geben kann, die beste Kandidaten fur em Zusammenpassen mit euier Substruktur m dem 
Stmolekul sind, und dies ist eine Foige davon, dafl eine gegebene Testoolekfilsubstruktur von mehrals einem 
MotekQl in der Datenbank D geteilt werden kann. Eine Bestiramung dieser Antworten(&i W*d<P) ^ j^V 
^mcmSSnTjener DatensaSe aus der Abstimmtabelle 700 mit einem ZaWwert (emer H»ufigke«) bewerteel. 
BrtweX. der (die) einen vorgegebenen Schwellwert 675 cbersteigt D.ese ansgewahken Datensfilze 725 

renrasOTtierenaieretonstru^^ . KU ^ mmtaM 

Wn und wieder kann es wfinschenswertsem, die hypotfaetiscfaen Anordnnngen m jenen aus der Absrtimnitabei- 
le 700 SESZ Sworten w verwenden. die sichauf das gleiehe Molekfil ays to Databank : D beaehen urn 
eneKonformationdes Molekfils zn bilden.die in Obereinsriramung nut sovielen dieser Antworten 
htWeui das fragliche MolekOl in diese Kkmformation gebracht wird, befindet es s«h in scmer bcstm^i^en 
ObeSSmuui mit dem Testmolekfil als ganzem Die Qualitat der Oberemsbmrnung ^^Jnf™ 
Molekulen variiert als Funktion des tatsScMchen Grades an Ahnliohkeit zwischen ihnea wenn afle Konforma- 
tinnendes identifizierten Molekfils berficksichtigt werden. Diese Kombination von Antworten kann nut mimma- 
S Wbnung«ufwanderreicht werden: jedeAntwort enthalt bereta Iaformanonen fiber die Aaordnung to 
mTgSTkWn, die mit der bestimmten starren Substruktur verknupft sind; da to magacfaen Vektoren 
toSrtonsbedingt starr an der jeweiiigen starren Substruktur angebunden sia4 P>f iert ^,^°^ Q m 
SSobalen Koortoatensystem 235 unmhtelbar die starre Substntonmdrfte 

der Substruktur ausgeben, in dem gieichen Koordinatensystem. Zwei Antworten, die dem glacben Molekul der 
SSS*S vSchiedenln starren Substrukturen entsprechen. die fiber eine djrehbarel Bmtog ver- 
bunden sind, konnen zn einer 'Zwei-Substruktur'-Teuanwort raitemander kombmiert werden, wean die Anord- 
nungder jeweifigen starren Substrukturen mit to Plaziening der gememsamen drehbaren Bindung, die sie 
veAh^VubeSm^reme Zwei-Substruktur-Teilantwort kann to weheren zu emer^^tertruk- 
SXtwo* nnter Verwendung der bypothedsdten Plazierung «ner drttten starren Subnruk^ inton 
^JZ^-. Molekfil erweitert werden. wenn die dritte Substruktur mit jeto to ersten zwei Substrukturen 

sWe tohbare Bindung in der Position und Orientierung plazfert. die von dem Zwe.-S^struktur-KDniplex 
^rdertwW Kbuweise kann dieser ProzeB mit dem neu gebikieten Drei-Substrukto-Komplex fortgesetzt 
werTeSo wSund so fort. Wena die Antworten. die den vorgegebenen Schwellwert uber^eUen^ 
Sabsatzenlhalten.der sichauf das gleiehe Molekfil berieh^kann es moghch sem,alle starrenSuWJ^des 
Moiekflls zu berficksicbtigen and sie in einer global konsistenten Konfbrmatton zu plazieren. Typ^herweKe 
eraugen to SstenW Antworten Komplexe starrer Substrukturen, die eine oder mehr Substrukturen von 
fedem der identifizierten MolekOle aus der Datenbank D beinhalten. 

Die von der Tabefle 700 erhaltenen Antworten benotigen einen mmimalen Bwed^gs^and, um jene 
KoSormationen zu erzeugen, welcbe die identifizierten Molekfile aus der Datenbank D in bester Oberemsnm- 

^!S^cnf£e^ffemSnni kann der Fachmann aqulvulentealteniative A^f^grfojrmen fflr die 
Mentifikation von Molekulen eatwickein, die ebenfalls mnerhalbto ErwSgungender ErfinOer uegen, 
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1. Verfabren zmn Speichera einer Darsteflung eines oder mehrererReferenzmotekule hielnem^efcherm 
einem Reohnersystem. wobei das Verfabren auf einem Rechnersystem durchgeffinrt wird und die Schntte 

^Erkennen entweder einer oder mehrerer starrer Substrukturen des Refereiizmolekals, wobei jede 
der starrea Substrukturen einen oder mehr Atomplatze aufweist, jeder to Atomplatze nut null oder so 
mehr Atomplatzen in der starren Substruktur uber eine nicht drehbare Bindung verbunden !st imd jede 
starre Substruktur eine globale Poation und eine gtebale Orientierung m emem globalen Koordmaten- 

b^^reSonzweiodermehrVektorenimtemerGrtBeuiuimchtu^ 

Orientierung bezfiglich einer ausgewahlten starren Substruktur, wobei die ausgewablte starre bun- ss 
$truktur eine der starren Substrukturen ist; t .. t „,,, ^ „ , „„„ n-j^n m 

c. Auswahiea eines Satzes von drei oder mehr Platzen, wobei sjch der ausgewablte Satz von Platzen m 
der ausgewahlten starren Substruktur befindet, der Satz von Mltzen em Koortoatensystemtupel 
faildet, wenigstens einer der Platze nicht kottinear mit den restEchen Platzen ist diePlatze ach a lemer 
festen Position bezfiglich der ausgewahlten starren Substruktur befinden und das Koordinatensystem- eo 
tuDelemtoidmenswnalesscMefwmU^ _ _ 

d. Auswahlen eines oder mehr toKoordmatensystemtupel und Erzeugen ernes Koordmatensystemfu- 
pelfeldes mit Informattonen, die mit jedem der ausgewahlten Koordmatensystemtupel verknupit sind; 

e^Speicbern eines Datensatzes in einer Datenstruktur, wobei die Datenstruktur ^Meh^ von » 
Datensatten aufweist. jeder Datensatz das KoordinatensystemtupelfeW und em Vektorfeld enthalt und 
das Vektorfeld Vektorinformationen, die sichauf jeden der Vektoren beziehen, sowie taformationen 
fiber die Identhaten des Molekfib und der ausgewahlten starren Substruktur enthalt 
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Z Verfahren nachAnspruch 1, wobei die Information in demKocrfnatensystemtupelfeld em Index isL 

3. Verfahren nach Anspruch 2, wobei der Index von geometrischen Informationen abgeleitet wird, die ridi 
auf den Satz von Platzen beziehea , 

4. Verfahren nach Anspruch 3, wobei der Index von einem oder raehreren der Ahstande zwischen jeweils 
zwei Platzen in dem Satz von Platzen abgeleitet wird ^ 
5 Verfahren nach Anspruch 3, wobei der Index von emem oder mehr der Wlnkel m emem oder menr der 
Dreiecke abgeleitet wird, die durch jeweils drei Platze in dem Satz von Platzea gebOdet werden. 

6. Verfahren nach Anspruch 3, wobei der Index von einer Kombination von null oder mehr Winkeln in 
einem oder mehr der Dreiecke, die durch jeweils drei Platze in dem Satz von Platzen gebildet werden, und 
null oder mehr Abstanden zwischen jeweils zwei Platzen des Satzes von Platzen abgeleitet wird 

7. Verfahren nach Anspruch 2, wobei der Index von physikalischer Information abgeleitet wird, die fur emen 
oder mehr der Platze des Koordinatensystemtupels charakteristisch ist 

8. Verfahren nach Anspruch 2, wobei der Index von chemischer Information abgeleitet wird, die fur einen 
oder mehr der Platze des Koordinatensystemtupels charakteristisch ist 

9. Verfahren nach Anspruch 2, wobei der Index von geometrischer Information, die sich auf null oder menr 
der Platze des Koordinatensystemtupels bezieht, physikalischer Information, die fur null oder mehr der 
Platze des Koordmatensystemtnpels charakteristisch ist, und chemischer Information abgeleitet wird, die 
fOr null oder mehr der Platze des Koordmatensystemtiipeb charakteristisch ist 

10 Verfahren nach Anspruch 1, wobei die Vektormfonnation jeden der Vektoren in dem schiefwinldigen 
lokalen Koordinatensystem eindeutig identifiziert und die VektOTnfomiation unter jeglicher Rotation und 
Translation des Satzes von Platzen, der das schiefwinklige lokale Koordinatensystem defmiert, invariant 

bleibt « « ■ « * n * 

11 Verfahren nach Anspruch 1ft wobei die Vektorinformadon Information fiber eine IdentitSt, ^Posi- 
tion, eine VektorgrdBe und eine Vektororientierung von jedem der Vektoren ist, die in dem lokalen 

« schiefwmkligcn Koordinatensystera dargesteQt werderL J ^ r L _ 

12. Verfahren nach Anspruch 1 1, wobei die Vektorinformation die Projektion von jedem der Vektoren auf 
eine oder mehr Achsen des lokalen schiefwinkugen Koordinatensystems enthalt 

13. Verfahren nach Anspruch 11, wobei einer oder mehr der Vektoren durch zwei oder mehr PHtze 
dargestellt wird, wobei die Piatze AtomplStze des Molekfib sind, das einen ersten und emen zweiten 

» Atomplatz bemhaltet, und der erste und der zweite Atomplatz die Position, GrSBe und Orientierung des 
ieweiligenVektorsdefinieneiL # . . 

14 Verfahren nach Anspruch 11, wobei einer oder mehr der Vektoren durch erne Punktposrtton emesfesten 
Punktes entlang derLange des Vektors,die VektorgrdBe und die Vektororientierung reprasenuert wird. 

15 Verfahren nach Anspruch 11, wobei einer oder mehr der Vektoren durch die Position repi^ennertwird, 
« wobei die Position durch zwei Vektorplatze bestimmt wird, die Vektorplatze Platze In demSatz von Platzen 

and und die Vektorinformationdes weiteren die GroBe und die Orientierung des Vektors bemhaltet 

16. Verfahren nachAnspruch 15, wobei einer oder mehr der Vektorplatze em Atomplatz ist 

17. Verfahrennach Anspruch 16, wobei ^ 

16 Verfahren nach Anspruch 11, wobei die Position, GroBe und Orientierung von emem oder mehr der 
40 Vektoren durch eine Matrix dargestellt werdea ...... 

19. Verfahren nach Anspruch 2, wobei die Vektorinformation des weiteren andere Informationen bemhaltet 
2a Verfahren nach Anspruch 19, wobei die andcren Informationen irgendeine oder mehr derfolgenden 
beinhalten: molekulare Identhat, Identitat der Substruktur, Information fiber Atomplitze und Mormatton 
uber Nicht-Atomplatze sowie Information fiber die Kardinalitat und Idenntat von emem oder menr der 

45 tt!^rfahren nach Anspruch 20, wobei die anderen Informationen des weiteren irgendeine oder mehr der 
fotgenden beinhaltea: 

ohysikalische Egenschaften und chemische EigenschafteiL , 
22 Verfahren nach Anspruch 1, wobei einer oder mehr der Platze indem Satz von Platzen em Atomplatz ist, 
so der starr mat der ausgewahlten starren Substruktur verbunden ist 

23. Verfahren nach Anspruch 1, wobei einer oder mehr der Platze ein Nicht-Atomplatz ist 

24. Verfahren nach Anspruch i, wobei einer der Platze ein erster Platz auf der ausgewahlten starren 
Substruktur ist und em weitcrcr Platz ein zweiter Platz auf einer zweiten starren Substoiikta 1st und wobei 
die ausgewahhc und die zweite starre Substruktur fiber eine drehbare Bindung verbunden and. 

35 25. Verfahren nach Anspruch 24, wobei der erste und der zweite Platz irgendehoer der folgenden sem kann: 
ein Atomplatz und ein Nicht-Atomplatz. . _ 

26. Verfahren nach Anspruch 25, wobei der erste Platz ein erster Atomplatz ist, der zweite Platz em zweiter 
Atomplatz ist und einer oder mehr der Vektoren die Position, GroBe und Orientierung emer drehbaren 
Bindung hat, die den ersten und den zweiten Atomplatz verbindet 

«, 27. Verfahren nach Anspruch I, das den weiteren Schritt umf afl t: _ „ . 

f . Wiederholen der Schritte d und e fur eines oder mehr der nicht ausgewahlten KcwrdmatensystemtupeL 
28. Verfahren nach Anspruch 27, wobei die Schritte d und e fur alle nicht ausgewahlten Kjwrcfiuatensystem- 

2SL V^a^°nach An^rucb 27, das den weiteren Schritt umfaBt: g. Wiederholen der Schritte c bis f fur 
cc einen oder mehr der nicht ausgewahlten Satze von Platzen. 

3a Verfahren nach Anspruch 29, wobei die Schritte c bis f ffir afle nicht ausgewahlten Satze von Platzen 

51^erfafe-«f^ Anspruch 29, das den weiteren Schritt umfaBt: h. Wiederholen der Schritte b bis g fur 
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^vS^ b bis g far alio lichen sta.cn Substrukturen 

SlerfaS^ 5 
^ItlT^T^l dieScbritte a bis i tor aOe nichtatagew^tenMolekfile wiederholt 

SvSbhrenzun, Speichem einer Darstellung von llSfie 
eLs Snersystems, wobei das Verfahren auf einem Rechnersystem durcbgefOhrt wird and die Scnntte ^ 

?S£ SES55!i drd Oder mehr Platzen, wobei die Platze sich in einer festea Position 
S Substruktur befinden und jeder beliebige Sate von Patten em 
Ko^StensySnpel ist, das ein schiefwinkliges lokales KoonEnatensystem defintert, wob« das » 
gSgS TKoordinatensystem zwei odcr mehr Seiten mh einem Winfcel zwischen euiem 

1L/S£E£ 1C5S?£& Koordinatensy^tupeto und Erzeugen van einem oder mehr 
Indizes von Informationen fiber jedes der ausgewahlten ^^^f" u ^ l ^{L lV , • die 
tStaeichern eines Datensatzes in ciner Datenstruktur, die in dem Speicher gespachert ist, wobei die zs 
Da^nSS^c Me^J vol Datensatzen aufweist, wobei jeder der Datensatee Vektormto 
toen ubS^der Referenzvektoren enthalt und der Datensatz mit einem der Indizes vexknupft ist 
und auf inn durcb Verwecden des Index zugegriffen werden kann. „_,„„„♦ 
36 VeXen nach Auspruch 35. wobei der Index aus Information.* i von zwei der to^wrtto 
SSSte und eine zweite Seite darstellen, wobei ein erster Winkel der Winkel zw^chen der ersten so 

^SSSnd, 36, wobei entweder die erste oder die zwehe Seite eine GroBe oberhalb eines 

?^bSa^ ^ 
S^aTdes^SStemtupels erzeugt wird. and die zweite Sete dte zweiilangste Scrte des ss 

^liks ist das dnrch die dreiMhgneder des ^ 

S^SSSaSS 3s!Tobei der erste Winkel eine GroBe oberhalb eines WinkdschweHwerts 

AeSe^arakt«S^on einem oder mehr der Atomplatze bembalten, die an dem Koordinatensy- 

SSS™ Berichten von Identitaten und eines Satzes von notweudigen starren Transfortnationen « 
£ em^mXS^molekule, die einem Testmofekul struktureU ahnfich smd. wobei das Verfahreu 
auf einem Rechnersystem durcbgefChrt wird und die Schntte umfaBt: 

T^sSavon einer oder mehreren starren Testsubstrukturen des Testmo^ wobe. jede der 
Sarre^tsubstnikturen einen oder mehr Atomplatze aufweist. jeder der Atomptee mit nuU oder 
Se^nltSateenin der starren Testsubstruktur durcfa eine nfcht ^^^^ ve'bunto so 
Xdjede starre Testsubstruktur eine bestunmte Position and eine besummte Onentierung in einem 
dreidimensionalen globalen RefeTenzkoordinatensystera besUzt; * m 
rAuSen eines Satzes von drei oder mehr Testplatzen, wobei der Sate von Testpktaenem 
TesSSensystemtupel ist. wobei wenigstens einer der Testplatze nJeht ^^J^^ _ 
chenTestplatzen & die TestpUltze sich in einer festen Position m bezug auf * e J*^^* 5 ?^ s 
befmden und jedes der Testtoordiiutensystemtupel ein dreidimensionales scbJefwinkliges lokales 

renSm^undex aus Informationen. die nut dem ausgewahheBTestkoordinatensystemtupel ver- ^ 

dv^wStden des Testkoordmatensystemtupelindex. der auf einen oder mehr Dateiisiteein einer in 
dVSeS g^peSSen DaSiuktu/zugretft wobei ate l>^ul^ eme M^bJ von 
Stens5tten aufweist. jeder der Datensfltze ein Rrferenzkoormnateusystem^ 
reSctorinformationsfeld enthalt, das Referenzkoordinatensystemtupelfeld emen Refere^kooJ- 

besitzt, der von einem Refere^rdimten^tem^^ « 
SLi oder mehr ReferenzplatzeaufeinerstarrenRef^^ 

SSniert wird. wobei das Referenzvektorf dd einen oder ^ S ^ 3 S£2S: 
renzvektorinformationen fiber die zwei oder mehr Referenzvektoren enthalt. jeder der Ref erenzveHo- 
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rea eine GrdSe und Richtung und eine feste Position und eine feste Orientiertmg bezOgtich cincr Oder 
mehr der starren Rcferenzsubstrukturen hat, jeder Eintrag des weiteren Referenzkoordinalensystem- 
tupelinformationen liber das ReferenzkoordinatensystcintupeL IdentHatsinformationen uber das Refe- 
renzmoiekfil und Informationen uber die starre Ref eren^oordinatensystemsubstruktur besitzt; 

e. Berechnen eines Testvektors for jeden der zwei oder mehr Referefizvektoren in dem schiefwmkligen 
lokalen Testkooitfinatensystem far jeden Eintrag in jedem Datensatz mit einem Referenzkoordinaten- 
systemtupelindex, der mit dem Testkoordmatensysteratupelmdex 2usammenpaBt, urn jeden der Test- 
vektoren in deni globalen Koordinatensystem anzuordnen; und 

f. Erzeugen eines Abstimmdatcnsatzes m emer Abstimmdatenstruktur fur jeden Eintrag in jedem 
Datensatz mit einem Referenzfex>nfcatensystemtupelindex, der mit dem Testkoordinatensystemtu- 
pelindex zusammenpa&t, wobei der Abstimradatensatz die Idenritatsinformation for das Rfiferenzmo- 
lekfll, die Identitatsinfonnation fur die starre Referenzkoonimatens^erasubstruktur und eine Anord- 
nungsinformation fur jeden der Testvektoren in dem globalen Koordinatensystem enthilt 

44. Verfahren nach Anspruch 43, wobei der Referenzkoonimatensystemnipelindex aus dem Referenzkoor- 
dmatensystemtupel erzeugt wird und der Testkoordinatensystemtupelindex aus dem ausgewahlten Testko- 
ordinatensystemtupel durch das gleiche Verfahren erzeugt wird. 

45. Verfahren nach Anspruch 43, das den weiteren Schritt umfaBt: 

g. Wiederholen der Schritte cbisffOr eines oder mehr der nicht ausgewahlten Testkoordmatensystem- 
tupeL 

4a Verfahren nach Anspruch 45, wobei die Schritte c bis f fur alle nicht ausgewahlten Testkoordinatensy- 
stemtupel wiederhoit werden. 

47. Verfahren nach Anspruch 45, das den weiteren Schritt umfaBt: 

h. Wiederholen der Schritte bbisgfOr einen oder mehr der nicht ausgewahlten ^tze von Testpiatzen. 

48. Verfahren nach Anspruch 45, wobei die Schritte b bis g fur alle nicht ausgewahlten Satze von Platzen 
25 wiederhoit werden. 

49. Verfahren nach Anspruch 48, das den weiteren Schritt umfaBt: 

L Wiederholen der Schritte a bis g fur eine oder mehr der nicht ausgewahlten starren Testsubstruktu- 

50. Verfahren nach Anspruch 48, wobei die Schritte a bis g fOr alle der nicht ausgewahlten Testsubstruku> 
30 rcn wiederhoit werden. , .„ , 

51. Verfahren nach Anspruch 49, wobei eine MuMptizitat des Auftretens fur eraen oder mehr idenusche 
Abstimmdateosatze fur jeden von einem oder nadir Satzen identischer Ab srimmdatensStze bestimmt wuU 

52. Verfahren nach Anspruch 51, wobei die Satze von AbstimmdatensStzen, <fce emen Multiplizitfitswert 
imterhalb eines Schwellwerts besitzen, elirniniert werden. j 

53. Verfahren nach Anspruch 51, wobei der Abstimmtabenendatensatz, der die hflchste Mulnphzatat des 
Auftretens aufweist, die IdCTth&t des Referenzmolekuls, das mit demTestmoIekQl zusanmienpaBt, und the 
Identhat der starren Referenzsubstruktur enthalt, die rait einer oder mehr der starren Tcstnwlekulsubstruk- 
turen zusammenpafit, and die Anordnungsinformadon die notwendigen starren Transformaticmen be- 
sihnmt, welche die Referenz- undTestmolekule ra Obereiristin^ 

54. Verfahren nach Anspruch 3> wobei der Index von FISchen abgelehet wird, die durch Verweoden von 
wenigstens drei Platzen in <Sem Subsatz von Platzen gebildet werden. 

55. Verfahren nach Anspruch 3, wobei der Index von Verhaltnissen vonFlachen abgeteitet wird, die durch 
Verwenden von wenigstens drei Platzen in dem Subsatz von Platzen gebildet werden. 

56. Rechnersystem zum Speichern einer Darstenung von einem oder mehr Referenzmolekulea m emem 
Speicher in dem Rechnersystem und zum Vergleichen von einem oder mehr der Referenzmolefcffle mit 
ememTestmoleku^das beinhaltet: 

a. eine Datenbank, die in dem Speicher gespeichert ist, wobei die Datenbank eine Darstdlung von emer 
oder mehr starren Substrukturen von jedem der Ref erenzmolekule besitzt, jede der starren Substruk- 
turen einen oder mehr Atomplatze aufweist, jeder der Atompiatze mh null oder mehr Atomplatzenm 
der starren Substruktur durch dne nicht drehbare Bindung verbimden ist, jede starre Substruktur erne 
globale Position und one gtobale Orientierung in einem globalen Koordinatensystem besitzt; 
h. einen Satz von drei oder mehr Platzen, wobei sich der Satz von Platzen in einer ausgewahlten starren 
Substruktur befindet der Satz von Platzen ein Koordinatoasystemtupe! bildet, wenigstens emer der 
Piatze nicht kollinear mh den restlichen Platzen ist, die Piatze sich in einer festen Position bezflgUch der 
ausgewahlten starren Substruktur befinden und das Koonmiatensystemtupel em dreicfimensionaies 
schiefwinWiges iotades Koordinatensystem defmiert; und . 
c eine Datenstruktur mit einer Mebrzahl von- Datensitzen, wobei jeder Datensatz em Koordmatensy- 
stemtupelfeld und ein Vektorfeld enthalt und das Vektorfeld Vektor-mfonnationen, die sich auf jeden 
der zwei oder mehr Vektoren beziehen, sowie Informationen flberdie IdenrMteu von einem oder mehr 
der Moiekfile und einer oder mehr der starren Substrukturen enthalt, wobei jeder der Vektoren eme 
GroBe und eine Richtung sowie eine feste Position und Orienuerung bezuglicb der aosgewahlten 
starren Substruktur besitzt und die ausgewahke starre Substruktur eine der starren Substnikturen ist 

57. Rechnersystem nach Anspruch 56, das des weiteren eine Abstimmdatenstruktur aufweist, wobei die 
AbstSmmdatenstruktur eine Mehrzahl von Abstimmdatens&tzen besitzt, wobei jeder der Absammdatensat- 
ze Informationen enthalt, welche die Identitat eines Referenzmolekuls. die Identitat emer starren Referenz- 
koordinatensystemsi^stnikriir und erne AiK>rdmings"uiforniation fur jeden der zwei oder mehr Testvekto- 
ren in dem globalen Koordinatensystem mh einem TestLx>rdiiiateiisystemtopeBiidex umfaBt wejeher der 
gleiche ist wie ein Refereiizkoordmatensystmtupeh^ der rait dem KoordinatensystemtupeifeM una 
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dem Vektorfeld verknupft ist, und dem Testkoordinatensystemtupelmdex ah das I^rdmateisystemtupe!- 
feliwobeiderTestkoordinatensystemtupelindex fur jede$ von dem einen oder melirausgewaMtenTestico- 
ordinatensystemtupel des Testmolekfils und aus Informationen erzeugt wird, die nut dem ausgewahlten 
Testkoordtoatensystemtupel verknupft sind, wobei jedes der ausgewahlten Testkoordinatensystemtupel 
aus einem Sate von drei oder mehr Testplatzen des Testmolekfils gebfldet wird, wemgstens emer _ der s 
Testplltze debt kollinear mit den restliehen Testplatzen Et, die Testplatze sichuiemer festen Position 
bezfigiich der starren Testsubstruktur auf demTestmolekul befindett und jedes der Testkoordmatensystem- 

tupd ein dreidirneimonales schiefwinkliges bkalesTestkoordmatensj^em definiert 

S&System nach Anspruch 57, wobei erne Muraplizital des Auftretens fur einen oder mehr •denOsche 
Abstomdatensatte fur jeden der einen oder mehr Satee von idennscben Abstimmdatensitzen besnmmt 10 

59. System nach Anspruch 58, wobei die S,atee von Abstimmdatensatzen, die einen MuMpBatatswert 
unterhalb eines Schweliwerts aufweisen, eliminiert werden. ^ . . 

60. Rechnersystem zum Sprichern einer Darstenung von einem oder mehreren I^erenzmolekulen m einem 
Richer indem Rechne^ystem und zum Vergleichen von einem oder mehr der Ref erenzmolekflte mrt is 

D^blffiSll'dien? to Speicher gespeichert sind, wobei die Datenbankmittel ernes oder mehr 
starre Substnikiurmrttel von jedem der Referenzmolekflle darsteUen, jedes, der starrer i Snbstruktar- 
mittel einoder mehr Atomplatzmittel besitet, jedes der Atomplatzmittel mrt null oder mehr Atomplatz- 
mhteln in den starren Substrukturmitteln durch eine nicht drehbare Bindung verbundea List und jedes » 
starre Substrukturmittel eine globale Position und eine globale Oriennerung m emem globalen Koordi- 

Sdrei oder mehr Platzmitteta. wobei der Sate von Piateen skh in einem ausgewahlten 
rtarrenSubstmktunnittel befindet, der Sate von Platzmitteta em Koorinaterisystemtupelmittel bflde^ 
wenigstens eines der Platzmittel nicht kollinear mit den restfichen Platzmitteta ist, die Platetmttel stch is 
in etaerfesten PosiuonbezfigUchderausgc*^enstarrenSuta 

natensystemtnpelmittel ein dreidimenswnales schiefwinkliges lokales Koordmatensystemmittel defl- 

a ehSenstrukturmrttel zum Speichem einer Mehrzahl von Datrasa^ttein, wobei jedes Daten- 
satemftel em Kcwrdinatensystemmpelfeld und ein Vektorfeld enthah, das Vektorfeld Vektormforma- so 
tionen, die slch auf jeden der zwet oder mehr Vektoren beziehen, sowie Inforn^tiou«n uber die 
Idenufiten von einem oder mehr der Molekfile und einem oder mehr der starren ^bsfriiktonmttel 
enthalt. wobei ieder der Vektoren eine Grofie und eine Richtung mit emer festen Position und 
Orientierung bezughch den ausgewahlten starren Suhstniktunmttehi besitzt und die ausgewahlten 
starren Substrukturraittel solche von den starren Substrukturmitteln sind. 35 
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